介绍

llm的一些入门扫盲知识,🤓️ai大神karpathy总结的比较全面,看完有些收获记录下。
视频地址:
Deep Dive into LLMs like ChatGPT is on under-the hood fundamentals of LLMs.
How I use LLMs is a more practical guide to examples of use in my own life.
Intro to Large Language Models is a third, parallel, more optional video from a longer time ago.

总结

glasp ai总结

翻译

概念

CoT

通过简单的 “请一步步思考再回答” 这样的提示,模型的表现就会大幅提升,这就是 提示词工程 的典型应用。

让模型使用工具解决数学问题

Q: 9.11和9.9哪个大(use code)
A: 9.9

fine web

一个公开的爬虫项目,爬取互联网的英文文本 fineweb

common crawl

一个共享的爬虫项目 common crawl

tokenizer

一个在线工具,可以将文本转换为token并可视化,便于测试和理解tokenization tiktokenizer

excalidraw

karpathy演示用的工具,应该是不错的在线绘图工具 excalidraw

bbycroft.net

著名的llm机制可视化工具bbycroft
这个网站主页有作者的自我介绍也挺有趣

llm.c

大神们用各种语言手撸的llm,只能膜拜llm.c

together.ai

host了所有开源模型,一站式体验,有几个免费的 together.ai

lmstudio.ai

本地快速搭建llm测试和学习环境的工具,有空需要尝试一下 lmstudio.ai

ainews

karpathy推荐的ai前沿信息发布网站,已订阅 ainews

lmarena.ai

一个llm benchmark排名网站,似乎是基于用户投票排名的 lmarena.ai