01
DiffSynth-Studio: AI 生圖、圖片編輯引擎
在這個數位化時代,人工智慧和機器學習的進步不斷推動著藝術和創意的邊界。今天,我們要探索的是一個名為 DiffSynth-Studio 的開源計畫,它以其獨特的魅力和強大的功能,在 GitHub 上贏得了3k 顆星星的認可。
1️⃣ DiffSynth-Studio簡介
DiffSynth Studio 是一個擴散引擎, 它重新構建了包括文本編碼器、UNet、VAE等在內的架構 ,既保持了與開源社群模型的相容性,又提高了計算效能。
它提供了許多有趣的特性,讓我們享受擴散模型的魔力,而且它 使用 Hunyuan-DiT 生成中文提示的影像,同時支持此模型的 LoRA 微調。
開源地址:https://github.com/modelscope/DiffSynth-Studio
2️⃣ 看看範例
DiffSynth-Studio 提供了豐富的 Python 範例,涵蓋了長視訊合成、影像合成、卡通渲染、視訊風格化等多個方面。下面是幾個典型例子:
長視訊合成
DiffSynth-Studio 包含一個視訊拓展模型,可以生成 128 幀。
影像合成
DiffSynth-Studio 能夠突破擴散模型的限制,生成高分辨率影像:
卡通渲染
DiffSynth-Studio能夠以卡通風格渲染現實視訊,並提供視訊編輯功能:
視訊風格化
簡單操作即可進行視訊風格化:
3️⃣ 安裝指南
想要體驗 DiffSynth-Studio 的魅力?安裝過程非常簡單,如下是透過部署計畫的方式安裝:
git clone https://github.com/modelscope/DiffSynth-Studio.git
cd DiffSynth-Studio
pip install -e .
使用 WebUI
透過 WebUI,你可以更方便地使用DiffSynth-Studio:
python -m streamlit run DiffSynth_Studio.py
DiffSynth-Studio 是一個創新的計畫,無論是透過 Python 程式碼還是 WebUI,使用者都可以輕松地探索和實作自己的創意。
讓我們一起期待 DiffSynth-Studio 未來的發展,看看它將如何繼續拓寬我們對視覺藝術的想象。
02
RTranslator: 全球首款開源即時轉譯神器
在這個全球化不斷加速的時代,語言障礙一直是人們溝通交流的一大難題。今天,我們要介紹的這款開源計畫—RTranslator,正是為了解決這一問題而生。
作為一款專為 Android 系統設計的即時轉譯套用,RTranslator 以其獨特的功能和開源精神,贏得了全球開發者和使用者的一致好評。 是 全球首款開源的 Android 即時轉譯套用。
1️⃣ 這是個啥?
RTranslator,全球首款開源的Android即時轉譯套用, 以其獨特的「對話模式」和「對講機模式」,讓使用者能夠與使用同一套用的其他人進行無縫交流,仿佛對方就在說你的母語。 目前,RTranslato r在 GitHub 上的 Star 數量已經達到了4k。
支持多種語言,包括中文、英語、日語在內的 30+ 種語言。
2️⃣ 看看有啥功能?
1)對話模式
對話模式是 RTranslator 的核心功能。使用者可以透過連線另一部使用該套用的手機,實作即時對話轉譯。
當對方接受你的連線請求後,你的手機將捕捉到的語音轉換為文本,並行送到對方的手機。對方的手機將收到的文本轉譯成他的語言,並透過喇叭或藍芽耳機播放出來。
2)對講機模式
對講機模式適用於快速對話場景,如街頭問路或與店員交流。在這種模式下, 手機麥克風將同時監聽兩種語言,並在檢測到對方說話的語言後,進行轉譯和播放。
這種模式不需要藍芽耳機,但只能實作兩人之間的對話。
3)文本轉譯模式
文本轉譯模式是一個傳統的文本轉譯器,但同樣非常實用。
3️⃣ 怎麽實作的?
RTranslator 使用了 Meta 的 NLLB 和 OpenAi 的 Whisper 兩款先進的 AI 模型進行轉譯和語音辨識,確保了轉譯的準確性和即時性。
這兩款 AI 模型都能直接在手機上執行,保證了使用者的私密安全,同時也使得 RTranslator 可以在離線狀態下使用,而不會損失轉譯品質。
4️⃣ 下載與安裝
使用者可以從 RTranslator 的 GitHub 頁面下載最新版本的 apk 檔進行安裝。首次啟動時,需要下載 1.2GB的轉譯和語音辨識模型。 安裝完成後,即可開始使用RTranslator。
為了確保開源計畫的穩定執行,建議使用至少 6GB RAM 的手機,並配備足夠快的CPU。
如果手機效能較差或需要更快的執行速度,使用者可以選擇使用 RTranslator 的1.0版本,但該版本需要 Google API 並進行一些初始設定。
5️⃣ 開源地址
RTranslator作為一款創新的開源轉譯套用,憑借其強大的功能和易用性,為廣大使用者提供了一個打破語言障礙的解決方案。我們期待它在未來能夠不斷完善和最佳化,為更多人帶來便利。現在就下載RTranslator,開啟你的無障礙溝通之旅吧!
開源地址:https://github.com/niedev/RTranslator
推薦閱讀
1.
2.
3.
4.