World Coin Clear
World Coin Clear
金融服務/教育網站

Galileo 推出首個大型語言模型 (LLM) 診斷和可解釋性平台以減少模型幻覺

24.06.23 01:05 AM

Galileo LLM Studio 包含多種免費工具,供數據科學家使用專有數據微調 LLM、創建和管理提示、識別潛在的模型幻覺等

今天,有史以來第一家面向 LLM 和計算機視覺的機器學習 (ML) 數據智能公司Galileo宣布了一套名為 Galileo LLM Studio 的新工具——現在可在此處用於候補名單註冊。隨著各種規模和跨行業的組織開始考慮生成 AI 的潛在應用,數據科學團隊比以往任何時候都更重要的是能夠訪問工具以快速輕鬆地評估這些大型語言模型 (LLM) 的結果並進行優化他們的表現。

Galileo 推出首個大型語言模型 (LLM) 診斷和可解釋性平台以減少模型幻覺
Galileo 推出首個大型語言模型 (LLM) 診斷和可解釋性平台以減少模型幻覺

Galileo LLM Studio專為高性能數據科學團隊設計,將作為LLM分析和即時管理的一站式平台。個人LLM Studio用戶將可以使用兩個免費工具來提高LLM性能和準確性:Galileo Prompt Inspector,它使用戶能夠識別潛在的模型幻覺;Galileo LLM 調試器,允許用戶使用自己的專有數據微調 LLM。


Galileo 聯合創始人兼首席執行官 Yash Sheth 說道。產品官“使 LLM 適應特定的現實世界應用程序比以往任何時候都更依賴於數據。如今,組織的數據是其唯一的差異化因素。Galileo LLM Studio 充當數據力量倍增器,使數據科學家能夠微調這些模型,並在適當的背景下使用最佳提示,設置適當的護欄並防止幻覺,”。


Galileo 聯合創始人兼首席技術官、蘋果早期工程師 Atindriyo Sanyal 表示:“從法學碩士獲得最佳輸出的一個主要因素在於探索可能輸入的語義搜索空間,從而解析出準確的用戶意圖。”在 Siri 上,允許 iPhone 應用程序開發人員利用 Siri 構建功能強大的自然語言處理 (NLP) 應用程序。“十多年前,我開始了人工智能的職業生涯。儘管當今的模型更加先進和強大,但決定語言模型輸出質量的原則仍然是相同的:通過利用不受模型和現有數據偏見的來源的共識來防止模型幻覺並減少模型偏差。我們在設計 Galileo LLM Studio 時考慮到了這些原則。”


“Galileo 的 LLM Studio 的推出為各行業開闢了令人興奮的新可能性。其全面的工具允許客戶使用自己獨特的數據微調大型語言模型,同時有效識別和管理模型幻覺。這不僅可以節省時間;它是一個遊戲規則的改變者,使公司能夠更有效、更自信地利用生成式人工智能,並提供正確的資源來確保模型的準確性和可靠性。”

Galileo 提示檢查器

借助 Galileo Prompt Inspector,用戶可以快速有效地識別潛在的模型幻覺,或法學碩士的過度自信、錯誤預測。檢查器提供幻覺可能性分數——顯示模型產生幻覺的地方,或生成不可靠和虛假的輸出,包括事實不准確的地方。有了這些信息,用戶就能夠更快地解決模型中的幻覺和其他錯誤,從而減少客戶遇到錯誤信息或其他不正確模型輸出的可能性。用戶還可以在一個平台上創建、管理和評估提示,然後將提示從 Galileo 傳輸到他們選擇的應用程序,例如 Langchain、OpenAI、HuggingFace 等。

Galileo Prompt Inspector 中的其他內置產品功能包括:

  • 能夠在一個地方組織即時項目、運行和查詢法學碩士;
  • 支持OpenAI和Hugging Face模型;
  • 協作功能可簡化跨多個團隊的提示工程;
  • 通過監控和估計 OpenAI 調用的成本,同時提供有關不起作用的關鍵信號,幫助最大限度地降低即時工程的成本;和
  • 提示及其結果的 A/B 比較。

Galileo 法學碩士調試器

借助 Galileo LLM 調試器,用戶將能夠使用自己的專有數據微調 LLM,確保模型的高性能。如今,這個過程經常通過電子表格和 Python 腳本以及人工策劃的標籤手動完成,這非常耗時、成本高昂且容易出錯。數據科學團隊可以將 LLM 直接連接到 Galileo LLM 調試器,以立即發現並修復數據集中模型遇到的麻煩錯誤;從而更快地開發性能更好的模型,提高團隊效率並全面降低成本。

Galileo LLM 調試器的潛在用例包括:

  • 醫療保健領域的一個數據科學團隊想要構建一個更智能的病歷匯總器。利用開源 LLM 將產生通用結果。因此,該團隊需要使用他們專有的 EMR 數據對 LLM 進行培訓。
  • 一家面向消費者的企業想要構建一個聊天機器人來回答客戶有關其業務、服務和產品的問題。
  • 一家金融機構希望匯總公司數據(財務、宏觀趨勢和行業新聞),以便對該企業的貸款進行有效的風險評估。

Galileo LLM Studio 候補名單和網絡研討會演示

有關 Galileo LLM Studio 的更多信息,請在此處註冊候補名單並在此處註冊調試 LLM:更好提示和數據質量網絡研討會的最佳實踐,時間為 6 月 22 日

關於伽利略

Galileo 的使命是為非結構化數據機器學習從業者創建數據智能工具。由於世界上超過 80% 的數據是非結構化的,並且最近的模型進步大大降低了將數據用於企業 ML 的障礙,因此迫切需要正確的以數據為中心的工具來快速構建高性能模型。Galileo 總部位於舊金山,得到了 Battery Ventures、Walden Catalyst 和 The Factory 的支持。

欲了解更多信息,請訪問https://www.rungalileo.io或關注@rungalileo。

World Coin Clear