一周涨了 15k 的 Star！炸裂开源！

2024-05-21码农

一键将URL转换为LLM友好输入的工具

Reader是由Jina AI开发的一项创新开源工具，致力于改善大型语言模型（LLMs）的输入质量。这个工具不仅免费、稳定，而且可扩展，是Jina AI核心产品之一。

开源地址：https://github.com/jina-ai/reader

它通过两个主要功能简化了信息的获取和处理：

1. URL转换： 通过在任何URL前添加 https://r.jina.ai/ ，Reader可以将网页内容转换为LLM友好的格式，自动为缺少 alt 标签的图片生成说明，并以特定格式呈现。

2. 网络搜索： 使用 https://s.jina.ai/ 前缀，Reader 能够搜索网络并返回最相关的五个结果，每个结果都以 LLM 友好的格式呈现。

举个例子

我在 GPT-4 的百度百科主页网址前添加 https://r.jina.ai/：

点击回车后，就会输出如下格式，该格式可以让 LLM 更好的提取信息：

2. 用C语言和CUDA训练大型语言模型

在深度学习领域，PyTorch和TensorFlow等框架几乎占据了主导地位。但如果你对底层原理充满好奇，或者想从头开始理解模型训练的每一个细节，那么 llm.c 项目绝对值得一探。

这个开源项目短短一周，就获得了 15k 的 Star！

llm.c 是一个用纯C和CUDA编写的大型语言模型（LLM）训练项目。它的核心目标是提供一个简单、清晰的实现（仅仅 1000 行代码），让用户能够在不需要庞大框架支持的情况下，训练和理解GPT-2模型。

这个项目不仅是对技术的一次挑战，也是对教育的贡献，因为它让用户能够深入到模型训练的每一个细节。

本项目以简洁、直观的方式，将复杂的深度学习模型训练过程用C语言呈现出来，让更多人能够接近并理解这一领域。

开源地址：https://github.com/karpathy/llm.c

历史盘点

逛逛 GitHub 每天推荐一个好玩有趣的开源项目。历史推荐的开源项目已经收录到 GitHub 项目，欢迎 Star：

地址：https://github.com/Wechat-ggGitHub/Awesome-GitHub-Repo