人工智能初創企業 Hugging Face 近日宣布,其由兩人組成的 H4 團隊正致力于開發工具和「配方」,以幫助 AI 社區構建類似于 ChatGPT 的人工智能聊天機器人。自 ChatGPT 發布以來,H4 團隊的成立便是為了復制其功能,使用開源庫和模型。
H4 團隊——名稱代表「有用、誠實、無害和友善」——現已推出多個開源的大型語言模型,包括最近由法國 AI 初創企業 Mistral 發布的 Mistral 7B 模型的精調、以聊天為中心的版本 Zephyr-7B-α。此外,H4 還對阿布扎比技術創新研究所的 Falcon-40B 模型進行了分叉,修改該模型以更有助于以自然語言響應請求。
為了訓練其模型,H4 團隊——如同 Hugging Face 的其他研究團隊一樣——依靠一個擁有 1000 多個 Nvidia A100 GPU 的專用集群。團隊成員 Lewis Tunstall 和 Ed Beeching 雖遠程工作于歐洲,但得到了來自 Hugging Face 內部多個團隊的支持,其中包括模型測試和評估團隊。
H4 團隊強調,小團隊的規模是一個有意的選擇,因為它使他們能夠更加敏捷地適應不斷變化的研究環境。此外,他們還與如 LMSYS 和 Llamaindex 等團隊進行了外部合作。
最近,H4 團隊一直在研究不同的對齊技術,并構建工具來測試社區和行業提出的技術到底有多有效。本月,該團隊發布了一本手冊,包含了構建 Zephyr 所使用的所有源代碼和數據集,H4 計劃隨著未來 AI 模型的發布更新這本手冊。
面對是否有來自 Hugging Face 高層將工作商業化的壓力的問題,Tunstall 表示 H4 并不直接通過其工具獲利。然而,他承認這些工具確實為 Hugging Face 的企業級服務——專家加速計劃——提供了支持,該計劃提供來自 Hugging Face 團隊的指導,以構建定制的 AI 解決方案。
在被問及 H4 是否認為自己與其他開源 AI 倡議(如 EleutherAI 和 LAION)競爭時,Beeching 表示這不是 H4 的目標。相反,他說,意圖是通過發布 H4 聊天模型的訓練代碼和數據集來「賦能」開放 AI 社區。
Beeching 補充說:「如果沒有社區的許多貢獻,我們的工作將無法實現。」


產品與服務
聯系站長
關于我們