|
Post by nurrmohammad on Apr 2, 2024 17:23:53 GMT -10
越來越明顯的是,負責任的人工智慧系統不可能由世界範圍內數量有限的人工智慧實驗室開發,。HuggingFace 團隊的Thomas Wolf 最近指出,人工智慧領域的關鍵變革得益於持續的開放知識共享。 只要我們讓更廣泛的社群參與進來,並扭轉建構難以檢查且掌握在少數實驗室手中的超大規模人工智慧模式的持續趨勢,生成式人工智慧就是一個強大的工具。 更具成本效益的生成人工智慧方法:利用知識圖增強法學碩士 增強資料檢索是一種新的生成人工智慧方法,它將深度學習的力量與傳統的資訊擷取和檢索方法結合。使用語言模型結合語義知識庫和神經搜尋來理解使用者查詢的上下文可以提供更相關和更準確的結果。 電腦科學家Zdenko “Denny” Vrandečić是 Wikidata 的共同創辦人,被認為是Google知識 丹麥 電話號碼 圖譜的教父,他清楚地展示了ChatGPT、Google 和Wikidata 之間的簡單查詢背後的不同效能(他使用查詢「Who create the School of雅典?」)。 計算資源存在差異,因此執行查詢的成本也存在差異。正如丹尼解釋的那樣,OpenAI 和谷歌依賴世界上最快、最廣泛的硬件,而維基數據則在「半廢棄」的單一伺服器上運行。從技術角度來看,這是顯而易見的,因為模型必須處理具有數千億潛在輸出(一個接一個)的多層。相反,對 KG(甚至像 Wikidata 一樣大)的查詢是一個簡單的查找:跨 1 億多個實體的對數運算。 與生成式人工智慧相關的高成本與模型的培訓(從數百萬到數十億美元)及其使用有關,這使得法學碩士對許多人來說難以獲得,而且對環境也不友善。當與結構良好的知識和神經搜尋相結合時,PaLM 2(小型版本)、Alpaca、BloomZ 和 Vicuna 等較小的模型仍然非常有效。 相對較小模型的出現為企業降低生產中微調和推理的成本提供了新的機會。隨著我們越來越少依賴 OpenAI 和其他知名科技公司,它有助於創建一個更廣泛、更安全的人工智慧生態系統。 在我最新的一項實驗中,我使用 Bard(基於 PaLM 2)來分析網頁的語意標記。在左側,我們看到在沒有外部知識的情況下以零樣本模式進行的分析,在右側,我們看到在提示中註入資料的相同模型(在上下文學習中)。 法學碩士在設計上會產生幻覺:僅巴德(左側)在完成過程中就犯了五個事實錯誤。當提供正確的數據時,它只犯了一個小錯誤(右側)。
|
|