Hi,骚年,我是大 G,公众号「 GitHub 指北 」会推荐 GitHub 上有趣有用的项目,一分钟 get 一个优秀的开源项目,挖掘开源的价值,欢迎关注。
导语
今天推荐一个中文诗歌古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。诗人包括唐宋两朝近 1.4 万古诗人,和两宋时期 1.5 千古词人。数据来源于互联网。
为什么要做这个仓库? 古诗是中华民族乃至全世界的瑰宝,我们应该传承下去,虽然有古典文集,但大多数人并没有拥有这些书籍。从某种意义上来说,这些庞大的文集离我们是有一定距离的。而电子版方便拷贝,所以此开源数据库诞生了。此数据库通过 JSON 格式分发,可以让你很方便的开始你的项目。
古诗采集没有记录过程,因为古诗数据庞大,目标网站有限制,采集过程经常中断超过了一个星期。2017 年新加入全宋词,全宋词爬取过程及数据分析。
高频词分析图
宋词受欢迎的词牌名
宋词高频词
宋词作者作品榜
唐诗高频词
唐诗作者作品榜
宋诗高频词
宋诗作者作品榜
数据集
唐诗宋诗
全宋词
五代·花间集
五代·南唐二主词
论语
诗经
幽梦影
四书五经
蒙學
纳兰性德诗集
案例展示
PeoTik 诗词 wordle 诗词解谜小游戏
中文诗歌主页是一个基于浏览器的诗词网站,包含唐诗三百首、宋词三百首等文集。
animalize / QuanTangshi 离线全唐诗 Android
justdark / pytorch-poetry-gen a char-RNN based on pytorch
Clover27 / ancient-Chinese-poem-generator Ancient-Chinese-Poem-Generator
chinese-poetry / poetry-calendar 诗词周历
chenyuntc / pytorch-book 简体唐诗生成(char-RNN),可生成藏头诗,自定义诗歌意境,前缀等。
okcy1016 / poetry-desktop 诗词桌面
huangjianke / weapp-poem 诗词墨客 小程序版
汉字之美 汉字之美是一个方便查询的诗词网站,简洁干净,方便使用。
PaddlePaddle / PaddleNLP 基于 ERNIE-GEN(Transformer)的深度学习诗词生成,可自行修改逻辑来生成多种诗词风格。
Harold-y / chinese-poetry-db-web 基于本仓库的 MySQL DB 整合 + 诗词 Web 端展示与检索
GitHub 地址
点击下方的公众号;
在后台发消息「 中文诗歌 」即可获取。