av免费福利片在线播放,99热精品久久只有精品,18video性欧美19sex,ysl蜜桃色www,国产精品一区二区久久国产

泡泡網新聞頻道 PCPOP首頁      /      新聞頻道     /      動態(tài)    /    正文

揭秘 NVIDIA AI Workbench 如何助力應用開發(fā)

  此類工作在過去可能需要復雜的設置,而新工具使這項工作變得空前簡單。

  可協(xié)助 AI 開發(fā)者構建自己的 RAG 項目、自定義模型等等,這些功能簡化了開發(fā)者的工作流。該工具是本月初在 展會上推出的 的一部分,它是一套用于自定義、優(yōu)化和部署 AI 功能的工具和軟件開發(fā)套件。復雜的技術任務有可能誤導專家并讓初學者難以上手,而 AI Workbench 使其復雜度大大降低。

  NVIDIA AI Workbench 是什么?

  用戶可免費使用 NVIDIA AI Workbench,用戶能夠在各類 GPU 系統(tǒng)(如筆記本電腦和工作站到數(shù)據中心和云計算)上開發(fā)、試驗、測試 AI 應用和制作 AI 應用原型。該工具為各類用戶跨系統(tǒng)創(chuàng)建、使用和共享 GPU 開發(fā)環(huán)境提供了新的方法。

  AI Workbench 如何助力解決 AI 項目的挑戰(zhàn)

  開發(fā) AI 工作負載從一開始就需要手動執(zhí)行一些通常來說很復雜的流程。

  設置 GPU、更新驅動和管理版本不兼容問題可能會很麻煩。在不同系統(tǒng)之間復制項目可能需要一遍又一遍地重復手動流程。復制項目時若出現(xiàn)數(shù)據碎片化和版本控制問題等不一致情況,還可能阻礙協(xié)作。各種設置流程、移動憑據和機密,以及更改環(huán)境、數(shù)據、模型和文件位置都會限制項目的可移植性。

  借助 AI Workbench,數(shù)據科學家和開發(fā)者可以更輕松地跨異構平臺管理工作和協(xié)作。該工具在開發(fā)流程的各個方面實現(xiàn)了集成和自動化,并具有以下特點:

  易于設置:AI Workbench 簡化了 GPU 加速的開發(fā)環(huán)境的設置流程,讓技術知識有限的用戶也能操作。

  無縫協(xié)作:AI Workbench 與 GitHub 和 GitLab 等版本控制和項目管理工具集成,有助于減少協(xié)作時可能產生的不便。

  從本地擴展到云端時保持一致性:AI Workbench 確??缍鄠€環(huán)境依然可以保持一致性,支持在本地工作站或 PC 和數(shù)據中心或云端之間擴容或縮容。

  利用 RAG 處理文檔,操作比以往更加順暢

  NVIDIA 提供 開發(fā)示例,協(xié)助用戶開始使用 AI Workbench。 就是一個例子:它在本地工作站、PC 或遠程系統(tǒng)上運行基于文本的自定義 RAG Web 應用來處理用戶的文檔。

  該 Workbench 項目支持 各種 LLM。此外,該項目的混合特性允許用戶選擇在何處運行推理。

  Workbench 項目讓用戶可以對開發(fā)環(huán)境和代碼進行版本控制。

  開發(fā)者可以在主機上運行嵌入模型,并在 Hugging Face 文本生成推理服務器上本地運行推理,在目標云資源上使用 NVIDIA 推理端點(如 ),或使用自托管微服務(如 或第三方服務)運行推理。

  混合式 RAG Workbench 項目還包括:

  性能指標:用戶可以評估基于RAG和非RAG的用戶查詢在每種推理模式中的表現(xiàn)情況。這些指標包括檢索時間、首 Token 延遲 (Time to First Token, TTFT) 和 Token 速率 (Token Velocity)。

  檢索透明度:面板會顯示精確文本片段(在向量數(shù)據庫中檢索到的語義相關度最高的內容),并且這些片段會被輸入到 LLM 中,以提高回復與用戶請求的相關度。

  響應自定義:用戶可以使用各種參數(shù)調整響應,例如要生成的最大令牌數(shù)、溫度和頻率懲罰。

  如需了解詳情,請前往 獲取更多資源。此外,社區(qū)成員還提供實用的視頻教程,例如下面來自 Joe Freeman 的教程。

  自定義、優(yōu)化、部署

  開發(fā)者經常試圖針對特定用例自定義 AI 模型。微調是一種通過使用額外數(shù)據訓練模型,進而改變模型的技術,該技術可用于風格遷移或改變模型行為。AI Workbench 也有助于進行微調。

  提供適用于各種模型的 QLoRa (一種可大幅減少內存需求的微調方法),并可通過簡單的圖形用戶界面實現(xiàn)模型量化。開發(fā)者可以使用公開或自有的數(shù)據集來滿足其應用的需求。

  微調完成后,用戶即可對模型進行量化以提高性能并減少顯存占用,然后將其部署到原生 Windows 應用進行本地推理或部署到 NVIDIA NIM 進行云推理。如需了解該項目的完整教程,請在 中進行查找。

  真正的混合式設計:隨時隨地運行 AI 任務

  上述的混合式 RAG Workbench 項目在多個方面采用混合式設計。除了提供推理模式選擇外,該項目還可以在 NVIDIA RTX 工作站和 GeForce RTX PC 上本地運行,或擴展到遠程云服務器和數(shù)據中心。

  用戶可以在自己選擇的系統(tǒng)上運行所有 Workbench 項目,并且不會在設置基礎設施方面產生開銷。在 AI Workbench 中查找更多關于微調和自定義的示例和說明。

  請訂閱,我們每周都會將新鮮資訊直接投遞到您的收件箱。

  ###

特別提醒:本網信息來自于互聯(lián)網,目的在于傳遞更多信息,并不代表本網贊同其觀點。其原創(chuàng)性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網有任何內容侵犯您的權益,請及時聯(lián)系我們,本站將會在24小時內處理完畢。
0人已贊

關注我們

泡泡網

手機掃碼關注