分享一個有點兒意思的開源計畫~
一、留痕
最近想訓練一個符合某人說話風格的 AI,微信的聊天記錄裏就有著豐富的訓練數據。
聊天記錄是珍貴的記憶,也是每一場對話、每一個互動的真情流露。
想要拿到這些數據,無論是保存備份還是用於 AI 訓練,手動拷貝都不現實。逛 Github 發現了這個不錯的計畫:留痕。
這是一名西北工業大學的學生開源的一個計畫,作者這樣說道:
使用方法非常簡單:將手機的聊天記錄遷移到電腦,然後使用
WeChatMsg
解密。
安卓:手機微信->我->設定->聊天->聊天記錄遷移與備份->遷移-> 遷移到電腦微信;
iOS:手機微信->我->設定->通用->聊天記錄遷移與備份->遷移-> 遷移到電腦微信。
遷移完成後重新開機微信,遷移前也最好提前備份一下聊天數據。
然後 clone 計畫並安裝依賴:
# Python>=3.10 僅支持3.10、3.11、3.12,請勿使用其他Python版本
git clone https://github.com/LC044/WeChatMsg
cd WeChatMsg
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
直接執行 main.py 即可解析數據。
python main.py
解析好的數據,可以做清洗,用於 AI 模型訓練,也可以用於個人的數據分析。
計畫地址:
https://github.com/LC044/WeChatMsg
最後,魚皮還是要提醒大家,對於不是很懂程式碼的同學,一定要謹慎使用此類讀取個人數據的計畫 / 軟體,防止個人私密的泄露。能看懂程式碼的同學,可以先全域觀察下有沒有 「後門」 和發請求的程式碼,再去使用。不過這個計畫 star 數超過 2w,已經很有名氣了,沒什麽問題,可以玩一玩 / 學一學。
有需要的自取。
又到了
收藏等於學會
的時候了~
👇🏻 點選下方閱讀原文,獲取魚皮往期編程幹貨。
往期推薦