當前位置: 妍妍網 > 碼農

微信聊天記錄匯出的開源計畫,火了!

2024-01-23碼農

分享一個有點兒意思的開源計畫~

一、留痕

最近想訓練一個符合某人說話風格的 AI,微信的聊天記錄裏就有著豐富的訓練數據。

聊天記錄是珍貴的記憶,也是每一場對話、每一個互動的真情流露。

想要拿到這些數據,無論是保存備份還是用於 AI 訓練,手動拷貝都不現實。逛 Github 發現了這個不錯的計畫:留痕。

這是一名西北工業大學的學生開源的一個計畫,作者這樣說道:

使用方法非常簡單:將手機的聊天記錄遷移到電腦,然後使用 WeChatMsg 解密。

安卓:手機微信->我->設定->聊天->聊天記錄遷移與備份->遷移-> 遷移到電腦微信;

iOS:手機微信->我->設定->通用->聊天記錄遷移與備份->遷移-> 遷移到電腦微信。

遷移完成後重新開機微信,遷移前也最好提前備份一下聊天數據。

然後 clone 計畫並安裝依賴:

# Python>=3.10 僅支持3.10、3.11、3.12,請勿使用其他Python版本
git clone https://github.com/LC044/WeChatMsg
cd WeChatMsg
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

直接執行 main.py 即可解析數據。

python main.py


效果演示

解析好的數據,可以做清洗,用於 AI 模型訓練,也可以用於個人的數據分析。

計畫地址:

https://github.com/LC044/WeChatMsg


最後,魚皮還是要提醒大家,對於不是很懂程式碼的同學,一定要謹慎使用此類讀取個人數據的計畫 / 軟體,防止個人私密的泄露。能看懂程式碼的同學,可以先全域觀察下有沒有 「後門」 和發請求的程式碼,再去使用。不過這個計畫 star 數超過 2w,已經很有名氣了,沒什麽問題,可以玩一玩 / 學一學。

有需要的自取。 又到了 收藏等於學會 的時候了~


👇🏻 點選下方閱讀原文,獲取魚皮往期編程幹貨。

往期推薦