珍島文生文內容生成算法是珍島信息技術(上海)股份有限公司推出的深度合成服務算法。該算法套用於智慧型對話場景,根據用戶輸入的文本數據,通過大語言模型生成符合用戶需求的文本回復。主要用於臻文(網站)。
2024年4月,珍島文生文內容生成算法備案通過。
基本介紹
- 軟體名稱:珍島文生文內容生成算法
- 開發商:珍島信息技術(上海)股份有限公司
- 備案號:網信算備310106378717301240015號
算法原理,運行機制,套用場景,算法目的,
算法原理
珍島文生文內容生成算法以已完成境內深度合成服務算法備案的文心大模型算法-2 為基礎。珍島文生文內容生成算法對用戶輸入數據進行預處理,將輸入的文本數據和預設的文字結合,便於獲取更高質量的回覆。珍島文生文內容生成算法調用文心大模型算法-2 的接口,將預處理後的輸入數據輸入文心大模型算法-2。文心大模型算法-2基於Transformer架構,並進行了知識圖譜增強。Transformer 是一種用於自然語言處理(NLP)的神經網路模型,它基於注意力機制,可以有效地模擬人類的語言理解能力。在大模型訓練中,通過知識圖譜,對訓練語料進行擴展和強化,以便增強大模型的事實性知識。珍島文生文內容生成算法對文心大模型算法-2 輸出結果進行後處理,檢測文心大模型算法-2 輸出結果的準確性及是否符合預期,並進行違禁詞過濾後,輸出最終數據處理結果。
運行機制
珍島文生文內容生成算法以已完成境內深度合成服務算法備案的文心大模型算法-2 為基礎,珍島文生文內容生成算法對用戶輸入數據進行預處理後輸入文心大模型算法-2,通過預處理用戶輸入的文本數據,並與預設的文字結合,可獲取更高質量的回覆,提升自然語言處理效果。文心大模型算法-2 根據用戶輸入的原始問題(prompt), 會自動進行語義分析, 檢索知識資料庫, 並獲得基本相關信息, 構建新的 prompt, 一起輸入大模型, 然後根據模型網路, 計算輸出下一個 token 的機率, 並將最佳 token 併入原始Prompt 重新輸入, 重新計算下一個 token, 循環往復, 直至token 機率低於閾值,形成完成的回答,同時結合內容審核等策略, 對原始問題進行修改, 最終輸出。珍島文生文內容生成算法對文心大模型算法-2 的輸出數據進行後處理,珍島文生文內容生成算法通過後處理技術檢測核驗輸出結果的準確性及是否符合預期,並將文心大模型算法-2的輸出數據進行關鍵字違禁詞過濾,避免輸出結果違反信息內容安全合規要求。
套用場景
企業用戶進行行銷文案創作的場景
算法目的
文生文內容生成算法是基於文心大模型算法-2的新一代生成式人工智慧大模型服務產品。文心大模型算法基於大規模訓練數據進行預訓練,並採用人工標註數據進行有監督精調與人類偏好和主流價值觀對齊,構建生成式人工智慧大模型。線上提供服務,根據用戶提出的問題,生成相應的文字或多模態回復內容,並通過算法提供對於用戶輸入和系統輸出的安全判別和保障能力。珍島文生文內容生成算法對文心大模型算法-2的輸出結果進行進一步檢測核驗後,向用戶輸出最終結果,確保算法輸出結果符合信息內容安全管理要求