本周概览#
本周正式进入 GEO(生成式引擎优化)专题——这是本课程区别于其他 SEO 课程的核心部分。你将从学术研究出发理解 GEO 的原理,完成 AI 搜索的技术配置,并建立你的 GEO 可见度基线。
课程内容#
实践练习#
本周学完后你应该能够#
关键术语#
GEO · RAG · GEO-bench · 答案块 · 内容-答案匹配度 · llms.txt · GPTBot · PerplexityBot · ClaudeBot · OAI-SearchBot · 爬取-引荐比 · Speakable Schema · GEO 基线测试
和前几周的联系#
- 第 1 周的 RAG 概述 → 本周深入引用决策机制的五大信号
- 第 3 周的答案优先写作 → 本周解释了为什么(40-60 词答案块最易被引用)
- 第 4 周的 robots.txt 和 Schema → 本周用 llms.txt 补齐 AI 爬虫的完整配置
- 第 2 周的关键词研究 → 本周的基线测试查询集设计
下周预告#
第 6 周:GEO 内容优化——被 AI 引用的写作术。把本周学到的理论转化为具体的写作方法,改写现有内容使其"AI 友好",并验证效果。
第 5 周 · GEO 基础——AI 如何选择引用你
欢迎来到课程的核心地带 从这周开始,我们进入 GEO(Generative Engine Optimization)——这是 2026 年搜索优化最前沿的领域,也是本课程区别于其他 SEO 课程的核心。
前 4 周学了什么(快速回顾) 如果你是按顺序学过来的,这是一个快速复习;如果你是直接跳到第 5 周的,这几条帮你补上前置知识:
第 1 周:搜索引擎的工作原理(爬取→索引→排名),AI 搜索的 RAG 机制,SEO 是地基、GEO 是新楼层 第 2 周:关键词研究——找到用户真正在搜索的词,理解搜索意图(信息型/导航型/交易型/商业调查型) 第 3 周:页面优化(On-Page SEO)——标题、Meta 描述、URL 结构、E-E-A-T 内容质量、内链和图片优化 第 4 周:技术 SEO——Core Web Vitals(网站速度指标)、robots.txt(告诉爬虫能不能进来的配置文件)、Schema Markup(结构化数据,让搜索引擎理解你的内容类型)、站点架构 如果某个词不熟悉,回去翻对应周的课程。第 5 周的内容会经常引用这些概念。
第 1 周我们简单介绍了 GEO 的概念。这节课要深入得多——从学术论文的研究结果出发,建立一套可执行的实战框架。
GEO 的学术起源 GEO 这个概念不是营销圈发明的——它来自严肃的学术研究。
核心论文:
标题:GEO: Generative Engine Optimization 作者团队:Princeton、Georgia Tech、Allen AI 研究所、IIT Delhi 发表:KDD 2024(ACM SIGKDD,数据挖掘领域的顶级会议) arXiv 编号:2311.09735 论文做了什么 研究团队构建了一个叫 GEO-bench 的基准测试框架,包含 10,000 条多样化用户查询(覆盖 9 个数据集),然后系统性地测试了 9 种不同的内容优化策略,看哪些能提升内容在 AI 生成回答中的可见度。
...
第 5 周 · GEO 基础——AI 如何选择引用你
robots.txt 之外——专门给 AI 看的文件 快速复习:robots.txt 是什么 robots.txt 是放在网站根目录(yoursite.com/robots.txt)的一个纯文本文件,用来告诉所有爬虫"哪些页面可以抓取,哪些不行"。你在浏览器里直接输入 yoursite.com/robots.txt 就能看到它的内容。
第 4 周会详细讲怎么配置它。如果你直接跳到这节课,只需要知道:本课末尾有一份完整的 robots.txt 示例,直接复制粘贴到你网站的根目录就能用。
“开了门”(robots.txt 允许 AI 爬虫)还不够——AI 进来之后,你的网站可能有几十上百个页面,它不知道哪些最重要。
llms.txt 是给 AI 爬虫一份导航图——告诉它"你进来了,这是我网站最重要的内容,按这个顺序看"。
什么是 llms.txt llms.txt 是一个放在网站根目录的 Markdown 格式文本文件(yoursite.com/llms.txt)。
它的目的是:
向 AI 系统提供网站的结构化概览 标注最重要的内容和它们的优先级 用 AI 能高效解析的格式呈现信息 为什么 Markdown 而不是 XML/HTML AI(大语言模型)天然擅长理解 Markdown——它是训练数据中最常见的格式之一 Markdown 比 HTML 更简洁,更少噪音 人也能直接阅读,便于维护 llms.txt 的格式规范 # 网站名称 > 一句话描述你的网站是做什么的 ## 核心内容 - [降噪耳机完全指南](https://yoursite.com/headphones/buying-guide): 涵盖降噪原理、选购方法、品牌对比和使用建议的综合指南 - [Sony XM6 vs AirPods Max 2 对比](https://yoursite.com/headphones/xm6-vs-airpods): 2026 年两款旗舰降噪耳机的详细逐项对比评测 - [降噪耳机工作原理](https://yoursite.com/headphones/how-anc-works): 主动降噪和被动降噪的技术解析 ## 评测与推荐 - [2026 年最佳降噪耳机推荐](https://yoursite.com/headphones/best-2026): 8 款降噪耳机的实测排名 - [Sony WH-1000XM6 评测](https://yoursite.com/headphones/xm6-review): 30 天使用体验详细评测 ## 常见问题 - [降噪耳机 FAQ](https://yoursite.com/headphones/faq): 关于降噪耳机的常见问题解答 ## 关于 - [关于作者](https://yoursite.com/about): 作者背景和联系方式 格式要点 用 # 作为网站标题 用 > 写一句话描述 用 ## 分类你的内容——按主题或内容类型分组 每个链接附简短描述——告诉 AI 这个链接里有什么 按重要性排序——最重要的内容放在最前面 只放你希望 AI 引用的页面——不放后台页面、登录页、低质量页面 llms.txt vs robots.txt vs sitemap.xml 文件 给谁看 做什么 格式 robots.txt 所有爬虫 告诉爬虫"能不能进来" 纯文本,规则格式 sitemap.xml 搜索引擎爬虫 列出所有需要索引的页面 XML llms.txt AI 爬虫 告诉 AI"进来后看什么最有价值" Markdown 三者互补:
...
第 5 周 · GEO 基础——AI 如何选择引用你
为什么需要基线测试 你不能优化你不衡量的东西。
不管你现在有没有网站,这节课都值得认真做。
如果你有网站:测自己当前在 AI 搜索中的可见度,找出优化方向 如果你只有知乎/小红书账号:测你的内容在 AI 中是否被引用,了解中文 AI 引用规律 如果你还没有任何内容:测你感兴趣的话题领域——了解谁是 AI 目前的"头部引用源",搞清楚将来需要超越的对手和他们的内容特征 在开始任何 GEO 优化之前,基线测试帮你回答:
AI 搜索引擎现在引用你(或你的领域)了吗? 它引用的是谁?他们的内容和你的有什么差异? 你的话题在 AI 搜索中的可见度基线是多少? 有了基线,后续每次优化后你才能对比:做了这个改变,AI 引用情况变好了还是没变?
选择你的测试平台 根据你的内容语言和目标用户,选择对应的 AI 平台来测试:
面向中文用户(优先测试):
平台 特点 引用来源偏好 Kimi(kimi.moonshot.cn) 中立性强,引用来源多样 知乎、独立博客、百科 DeepSeek(chat.deepseek.com) 技术内容权威,日常内容也强 知乎、专业媒体 文心一言(yiyan.baidu.com) 百度系,偏好百度生态内容 百度百科、百家号、知乎 豆包(doubao.com) 字节系,偏好头条系内容 今日头条、知乎、小红书 面向英文用户(同时测试):
平台 特点 引用来源偏好 Perplexity(perplexity.ai) 引用最透明,来源可见 Reddit、专业媒体、维基 ChatGPT(chatgpt.com) 需要开启"Search the web" Reddit、官方来源 Google(google.com) 查看 AI Overview 高权威站点、Reddit 建议:
...
第 5 周 · 动手环节
练习目标 本周的实践分两部分:
技术配置:把 GEO 的技术基础部署到位 基线测试:摸清你在 AI 搜索中的现状 预计时间:3-4 小时
Part 1:GEO 技术配置 练习 1:创建 llms.txt 为你的网站(或计划中的网站)创建一个 llms.txt 文件。
步骤:
列出你网站上最重要的 10-20 个页面 按主题或内容类型分组 为每个链接写一句描述 按照以下格式组织: # [你的网站名称] > [一句话描述你的网站] ## [分类1] - [页面标题](URL): 简短描述 - [页面标题](URL): 简短描述 ## [分类2] - [页面标题](URL): 简短描述 ## 关于 - [关于作者](URL): 作者背景和专业领域 保存为 llms.txt,部署到网站根目录 如果你还没有网站:先在本地创建这个文件,等建站时部署。把它当作你的"内容规划图"。
提交物 [ ] llms.txt 文件内容 [ ] 包含的页面数量:[x] [ ] 分了几个类别:[x] [ ] 每个链接都有描述:[是/否] 练习 2:检查/更新 robots.txt 如果你有网站,检查 robots.txt 的 AI 爬虫配置。
...