笔记:深入了解LLMs
介绍
llm的一些入门扫盲知识,🤓️ai大神karpathy总结的比较全面,看完有些收获记录下。
视频地址:
Deep Dive into LLMs like ChatGPT is on under-the hood fundamentals of LLMs.
How I use LLMs is a more practical guide to examples of use in my own life.
Intro to Large Language Models is a third, parallel, more optional video from a longer time ago.
总结
翻译概念
CoT
通过简单的 “请一步步思考再回答” 这样的提示,模型的表现就会大幅提升,这就是 提示词工程 的典型应用。
让模型使用工具解决数学问题
Q: 9.11和9.9哪个大(use code)
A: 9.9
fine web
一个公开的爬虫项目,爬取互联网的英文文本 fineweb
common crawl
一个共享的爬虫项目 common crawl
tokenizer
一个在线工具,可以将文本转换为token并可视化,便于测试和理解tokenization tiktokenizer
excalidraw
karpathy演示用的工具,应该是不错的在线绘图工具 excalidraw
bbycroft.net
著名的llm机制可视化工具bbycroft
这个网站主页有作者的自我介绍也挺有趣
llm.c
大神们用各种语言手撸的llm,只能膜拜llm.c
together.ai
host了所有开源模型,一站式体验,有几个免费的 together.ai
lmstudio.ai
本地快速搭建llm测试和学习环境的工具,有空需要尝试一下 lmstudio.ai
ainews
karpathy推荐的ai前沿信息发布网站,已订阅 ainews
lmarena.ai
一个llm benchmark排名网站,似乎是基于用户投票排名的 lmarena.ai
All articles on this blog are licensed under CC BY-NC-SA 4.0 unless otherwise stated.