全球第一個 2D 真人級、AIGC 即時渲染數位人模型開源了! DUIX 是矽基智慧打造的數位人智慧互動平台。
開源計畫提供了詳細的開放文件,方便你輕松開發出客製化的虛擬人套用。 借助這個開源計畫, 開發者能夠在 Android 或者 iOS 上一鍵部署數位人,為你的使用者提供即時的虛擬人互動體驗。
矽基數位人SDK是完全開源的,底層推理引擎以及上層的商業化套用邏輯都開放了原始碼。你可以深入了解其工作原理,並進行進一步的最佳化和創新。
開源地址:https://github.com/GuijiAI/duix.ai
01
開源數位人多強?
這個開源的SDK不僅提供了直觀的效果展示,還支持使用者進行二次開發,核心功能有:
① 數位人形象樣版: 提供了 14 個數位人樣版,你可以前往開源計畫的地址下載和使用這些數位人模型。矽基數位人還會非週期性更新本地模型包,以便下載和使用最新的模型
② 部署成本低: 支持低成本快速部署在 iOS、安卓或者大屏上。並且在平板、車載系統上也能流暢執行。
③ 畫面流暢: 支持 50 幀/秒的流暢畫面,視訊生成效率超過 1:0.5、滿足直播等一些對即時性要求很高的場景
④ 真實模擬: 數位人行業頂級的真實度,能夠精準的模擬動作、說話的唇形、微表情
⑤ 可以搭建的場景: AI伴侶、直播帶貨、數位人短視訊生成、批次數位人口播視訊內容生成,用於抖音/視訊號等平台的行銷推廣、品牌IP、內容制作。
圖片素材來源於矽基智慧官方公眾號推文
02
看看效果?
這裏是一個數位人的真實 Demo,能夠對對話的人的話有比較合理的理解和反饋。有一個問題就是你說完話,數位人大概需要反應 3~4 s 才有反饋。但是隨著端側模型的效能最佳化,這個問題很快可能就會被解決。
03
如何部署使用?
安卓 SDK 整合教程
該開源計畫提供了詳細的使用部署教程,可以移步該計畫的地址去檢視,我直接把重要的部份貼在了下方。
iOS 部署方式
SDK 提供了多種回呼方法,包括數位人渲染報錯回呼、音訊播放結束回呼、音訊播放進度回呼等。
動作相關的還支持隨機動作、開始動作、結束動作等。建議前往開源計畫去檢視詳細文件。
NSString *basePath =[NSString stringWithFormat:@"%@/%@",[[NSBundle mainBundle] bundlePath],@"gj_dh_res"];
NSString *digitalPath =[NSString stringWithFormat:@"%@/%@",[[NSBundle mainBundle] bundlePath],@"lixin_a_540s"];
//初始化
NSInteger result= [[GJLDigitalManager manager] initBaseModel:basePath digitalModel:digitalPath showView:weakSelf.showView];
if(result==1)
{
//開始
[[GJLDigitalManager manager] toStart:^(BOOL isSuccess, NSString *errorMsg) {
if(!isSuccess)
{
[SVProgressHUD showInfoWithStatus:errorMsg];
}
}];
}
04
誰開源的?
看了一下開源該計畫的開發者,是叫做矽基智慧的 AI 公司。我之前還經常刷到他們的短視訊。 這個公司已成功複制 50 萬數位人,實作 AIGC 產品在十多個行業的商業化套用。
為了降低技術門檻,為個人開發者和企業提供參與數位人的創新的機會, 矽基智慧公開數位人技術的核心程式碼。
開源地址:https://github.com/GuijiAI/duix.ai
算是為推動數位人技術的快速發展和普及出一份力!respect 🫡
推薦閱讀
1.
2.
3.
4.