當前位置: 妍妍網 > 碼農

推薦 2 個 昨日 火火火 的開源計畫

2024-06-27碼農

01

DiffSynth-Studio: AI 生圖、圖片編輯引擎

在這個數位化時代,人工智慧和機器學習的進步不斷推動著藝術和創意的邊界。今天,我們要探索的是一個名為 DiffSynth-Studio 的開源計畫,它以其獨特的魅力和強大的功能,在 GitHub 上贏得了3k 顆星星的認可。

1️⃣ DiffSynth-Studio簡介

DiffSynth Studio 是一個擴散引擎, 它重新構建了包括文本編碼器、UNet、VAE等在內的架構 ,既保持了與開源社群模型的相容性,又提高了計算效能。

它提供了許多有趣的特性,讓我們享受擴散模型的魔力,而且它 使用 Hunyuan-DiT 生成中文提示的影像,同時支持此模型的 LoRA 微調。

開源地址:https://github.com/modelscope/DiffSynth-Studio

2️⃣ 看看範例

DiffSynth-Studio 提供了豐富的 Python 範例,涵蓋了長視訊合成、影像合成、卡通渲染、視訊風格化等多個方面。下面是幾個典型例子:

長視訊合成

DiffSynth-Studio 包含一個視訊拓展模型,可以生成 128 幀。

影像合成

DiffSynth-Studio 能夠突破擴散模型的限制,生成高分辨率影像:

卡通渲染

DiffSynth-Studio能夠以卡通風格渲染現實視訊,並提供視訊編輯功能:

視訊風格化

簡單操作即可進行視訊風格化:

3️⃣ 安裝指南

想要體驗 DiffSynth-Studio 的魅力?安裝過程非常簡單,如下是透過部署計畫的方式安裝:

git clone https://github.com/modelscope/DiffSynth-Studio.git
cd DiffSynth-Studio
pip install -e .

使用 WebUI

透過 WebUI,你可以更方便地使用DiffSynth-Studio:

python -m streamlit run DiffSynth_Studio.py

DiffSynth-Studio 是一個創新的計畫,無論是透過 Python 程式碼還是 WebUI,使用者都可以輕松地探索和實作自己的創意。

讓我們一起期待 DiffSynth-Studio 未來的發展,看看它將如何繼續拓寬我們對視覺藝術的想象。

02

RTranslator: 全球首款開源即時轉譯神器

在這個全球化不斷加速的時代,語言障礙一直是人們溝通交流的一大難題。今天,我們要介紹的這款開源計畫—RTranslator,正是為了解決這一問題而生。

作為一款專為 Android 系統設計的即時轉譯套用,RTranslator 以其獨特的功能和開源精神,贏得了全球開發者和使用者的一致好評。 全球首款開源的 Android 即時轉譯套用。

1️⃣ 這是個啥?

RTranslator,全球首款開源的Android即時轉譯套用, 以其獨特的「對話模式」和「對講機模式」,讓使用者能夠與使用同一套用的其他人進行無縫交流,仿佛對方就在說你的母語。 目前,RTranslato r在 GitHub 上的 Star 數量已經達到了4k。

支持多種語言,包括中文、英語、日語在內的 30+ 種語言。

2️⃣ 看看有啥功能?

1)對話模式

對話模式是 RTranslator 的核心功能。使用者可以透過連線另一部使用該套用的手機,實作即時對話轉譯。

當對方接受你的連線請求後,你的手機將捕捉到的語音轉換為文本,並行送到對方的手機。對方的手機將收到的文本轉譯成他的語言,並透過喇叭或藍芽耳機播放出來。

2)對講機模式

對講機模式適用於快速對話場景,如街頭問路或與店員交流。在這種模式下, 手機麥克風將同時監聽兩種語言,並在檢測到對方說話的語言後,進行轉譯和播放。

這種模式不需要藍芽耳機,但只能實作兩人之間的對話。

3)文本轉譯模式

文本轉譯模式是一個傳統的文本轉譯器,但同樣非常實用。

3️⃣ 怎麽實作的?

RTranslator 使用了 Meta 的 NLLB 和 OpenAi 的 Whisper 兩款先進的 AI 模型進行轉譯和語音辨識,確保了轉譯的準確性和即時性。

這兩款 AI 模型都能直接在手機上執行,保證了使用者的私密安全,同時也使得 RTranslator 可以在離線狀態下使用,而不會損失轉譯品質。

4️⃣ 下載與安裝

使用者可以從 RTranslator 的 GitHub 頁面下載最新版本的 apk 檔進行安裝。首次啟動時,需要下載 1.2GB的轉譯和語音辨識模型。 安裝完成後,即可開始使用RTranslator。

為了確保開源計畫的穩定執行,建議使用至少 6GB RAM 的手機,並配備足夠快的CPU。

如果手機效能較差或需要更快的執行速度,使用者可以選擇使用 RTranslator 的1.0版本,但該版本需要 Google API 並進行一些初始設定。

5️⃣ 開源地址

RTranslator作為一款創新的開源轉譯套用,憑借其強大的功能和易用性,為廣大使用者提供了一個打破語言障礙的解決方案。我們期待它在未來能夠不斷完善和最佳化,為更多人帶來便利。現在就下載RTranslator,開啟你的無障礙溝通之旅吧!

開源地址:https://github.com/niedev/RTranslator

推薦閱讀

1.

2.

3.

4.