close

這篇推送,以至於這次的更新,其實應該在兩周前發布的,如果我們沒有一個接一個的陽了的話。好在我們在上周快結束的時候,團隊所有人都基本轉陰了,我們在這周開始繼續恢復正常工作,然後將這次的更新上線。

我們處在一個快速變化的時代,在 6pen 所在的這個領域更是如此,從市場上來看,文生圖似乎已經是昨日黃花,如今新的熱點已經變成 chatgpt 這樣的文本對話模型,一方面,我們認為在圖像領域,人類創造和建立的技術,場景和應用還遠遠沒有到達最終境地,另一方面,我們也對新模態的各種技術充滿興趣和好奇。

因此,我們將繼續在圖像生成上做更多「新技術-創新產品」結合的工作,也將開始探索新的模態。

不得不說,能夠把人生的精力投入到這樣的事情當中,我認為這是一件幸事。

我們將在接下來對 6pen 進行一系列更新,而其中第一個,就是定製模型。

定製模型可以讓你用十幾張照片或者圖片,訓練一個屬於你的模型,這個模型可能知道你長什麼樣子,或者你的玩具是什麼樣子,或者能知道你的畫風,你可以取一個名字,例如「王二」,或者「老王的無人機」,或者「王二手繪風格」,然後你就能在文本描述中用「王二穿着超人衣服的自拍照」來生成你穿着超人衣服的圖片,用「老王的無人機在珠穆朗瑪峰飛行」來生成你的玩具飛機在珠峰飛行的圖片。

舉個例子,以下是我的照片(大概看看就行了,我懇請大家不要點開大圖看),它們被用來訓練了一個定製模型,叫做「DK加強版」

這個模型知道我長什麼樣子,所以我可以在文本描述里加入「DK」,模型就能生成出我的樣子來,這是使用這個定製模型,根據不同的描述生成的圖片

上面的例子,只是我調配的一些文本描述,你可以自己去嘗試,去寫各種風格,各種場景的文本來生成,可能會不太行,也可能有驚喜,但都有你在其中。

我的朋友和前同事老韓也做了測試,她的結果也很不錯,這是她用來訓練的照片的其中幾張:

這是她用訓練完的模型生成的一些圖:

一直以來老韓都希望當一個職業女強人,我們也能從她的圖九中感受到這份心思。

在技術界,這其實不算什麼新鮮的東西,諸如 DreamBooth、Textual Inversion、Aesthetic Gradients 等技術,很早就可用於模型的定製訓練,但它們的問題在於,效果好的,算力成本往往高;算力成本低的,效果往往就差。

此外還有一個共同的問題,就是使用門檻高,需要比較繁瑣的設置和一些代碼能力,模型文件管理和長期的調用等問題也很棘手,所以即便你看到有一些支持讓你上傳一些圖,然後得到一些圖的服務,他們也只是一次性的生成一些圖給你,不會允許你自己把玩這個模型。

無需隱瞞,6pen 的長處不是在底層技術上做突破——我們欽佩能做到這些的人,但我們的長處是將好的技術,工程化,進而產品化,從而以合理的方式,低廉的成本,給更多普通人帶來使用新技術的機會,並產生更多可能性。

定製模型正是如此,我們將多項開源的訓練技術進行有效的融合,在算力成本和效果上取得平衡,然後使用了一個高效靈活的算力集群為其服務,並在終端的用戶操作頁面上進行優化,從而實現了現在的,1分鐘即可完成創建,20分鐘跑完訓練,不到 10 塊錢就能完成的定製模型。

定製模型訓練完畢後,我們會免費幫你用其生成大約 50 張圖片,這些圖片使用我們測試過比較好的文本描述來生成,某些類似服務,到這裡就結束了,屬於一次性買賣,但在 6pen 這只是一個開始,事情並沒有結束,因為你還可以自己自由的寫描述去生成,去調試,去調用和探索你訓練的模型。

關於定製模型的使用方式,訓練建議,費用(超便宜),隱私規則,我們在文檔中有更詳細的介紹,你也可以在我的-定製模型里去親自體驗。

老實說,目前的定製模型還處在一個比較初級的階段,受限於各種限制,我們無法完全採用能實現最好效果的方案,但我們會在未來對其進行不斷優化,可能幾個月後,效果還會有很大的提升,更多品類,包括風格的訓練,我們也會在未來推出。

定製模型意味着什麼?我認為它意味着一種可能性,一種真正參與其中的可能性,從此,生成式AI,將和你個人,有某種關聯,我們一直以來所稱呼的模型,不再是所有人都使用同樣一個 pth 文件,然後隨便找一塊 GPU 開始推理,而是有了你個人的部分,或者中二一點稱之為印記也可以。

另一方面,能夠生成某種相對固定的人臉,物體,風格,也可以幫助你實現更好的創意,做出更好的策展,我們還會發布一些新的玩法,利用定製模型,也能取得更有意思的結果。

祝大家訓練愉快,身體健康。

arrow
arrow
    全站熱搜
    創作者介紹
    創作者 鑽石舞台 的頭像
    鑽石舞台

    鑽石舞台

    鑽石舞台 發表在 痞客邦 留言(0) 人氣()