Appearance
搜索引擎索引提交清单 (Indexing Checklist)
目标: 让 Google、Bing、百度、搜狗及 AI 平台(ChatGPT search、Perplexity、Gemini、Grok)能发现并索引
gptpluszh.com全部 79 页内容。
1. VitePress SSG 已验证 ✅
所有 80 个 HTML 页面(含 404)在 vitepress build 后都已在 <div id="app"> 内完整预渲染为静态 HTML,零 SPA-only 页面。搜索引擎爬虫无需执行 JavaScript 即可看到全部正文、导航、结构化数据。
验证命令:
bash
npm run docs:build
node audit-ssg.cjs # 输出 Top / Bottom 页面内容量
node audit-sitemap.cjs # 输出 sitemap URL 覆盖率2. Google Search Console — 提交 sitemap(立即执行)
2.1 验证站点所有权
如果尚未验证,用以下任一方式:
- DNS TXT 记录(推荐,覆盖全站 + 子域名):GSC 提供值 → 加到 DNS 的 TXT 记录
- HTML 文件:下载 GSC 提供的
googleXXXX.html→ 放到public/目录 → 重新bash deploy.sh
2.2 提交 sitemap
- 登录 Google Search Console
- 选择属性
gptpluszh.com(或https://gptpluszh.com) - 左侧导航 → Sitemaps → 输入
sitemap.xml→ 点击 提交 - 预期:显示 "已成功提交" + 处理中的 URL 数量(79 页)
2.3 提交 IndexNow(已自动化)
deploy.sh 每次部署自动调用 indexnow-ping.mjs,向 api.indexnow.org 提交前 1000 条 sitemap URL。Google 已加入 IndexNow 协议,Bing/Yandex/Seznam 均支持。
2.4 48–72 小时后验证
site:gptpluszh.com在 Google / Bing 搜索框输入上述命令,预期看到 ≥ 50 页被索引。若结果 < 10,检查 GSC → 页面 → 未被编入索引的页面 → 查看具体原因(已抓取-尚未编入索引 是正常的短期状态)。
3. Bing Webmaster Tools — 提交 sitemap(立即执行)
3.1 导入站点(如尚未验证)
- 登录 Bing Webmaster Tools
- 点击 添加网站 → 输入
https://gptpluszh.com - 如果已有 GSC 验证,可直接 从 GSC 导入 跳过二次验证
- 否则用 DNS TXT / XML 文件 验证
3.2 提交 sitemap
- 左侧导航 → Sitemaps → 输入
https://gptpluszh.com/sitemap.xml→ 提交 - IndexNow 已通过
deploy.sh自动通知 Bing(Bing 是 IndexNow 协议发起方,优先级最高)
3.3 百度搜索资源平台(可选)
由于站点语言为 zh-Hans 且目标用户在中国大陆:
- 登录 百度搜索资源平台
- 站点验证 → sitemap 提交
https://gptpluszh.com/sitemap.xml - 百度不参与 IndexNow 协议,需通过百度自己的 API 提交
4. 其他搜索引擎(按需)
| 搜索引擎 | sitemap 提交地址 | 备注 |
|---|---|---|
| 搜狗 | 搜狗站长平台 | 中文搜索次要来源 |
| Yandex | webmaster.yandex.com | IndexNow 已自动通知 |
| Seznam | search.seznam.cz | IndexNow 已自动通知(捷克) |
5. AI 引擎发现(被动,无需提交)
AI 爬虫通过以下方式发现本站:
| 平台 | 发现方式 | 状态 |
|---|---|---|
| ChatGPT search | OpenAI 整合 Bing 索引 | IndexNow (Bing) ✅ |
| Perplexity AI | PerplexityBot 爬虫 + Bing 索引 | IndexNow ✅ |
| Google Gemini | 直接读 Google 索引 | sitemap ✅ |
| Grok (xAI) | 整合 Bing 索引 + Twitter 链 | OG/Twitter card ✅ |
| Claude.ai | 未接外部搜索;需主动提交 llms.txt | public/llms.txt ✅ |
重要: AI 爬虫的发现依赖传统搜索引擎索引 — 先索引,后 AI 发现。不需要(也无法)向 AI 平台直接提交。
6. 问题排查
sitemap 提交失败
bash
# 本地验证 sitemap 格式
curl -s https://gptpluszh.com/sitemap.xml | head -20
# 确认 robots.txt 链接正确
curl -s https://gptpluszh.com/robots.txt页面 "已抓取-尚未编入索引"
- 正常状态,Google 需要 1–3 天评估页面质量
- 确保页面有 ≥ 300 字正文 + canonical 链接 + meta description
- 如果没有改善,检查 GSC → 手动操作 → 有没有处罚
IndexNow 提交失败
deploy.sh输出中的[IndexNow] ⚠️行会显示错误详情- 确认
https://gptpluszh.com/159b452719f12074dd9818432b809e7ed3ba0fad58b0ae8405c031775c100b69.txt可访问(返回 key 值) - 网络波动时会打印
non-fatal— sitemap 兜底仍然有效
7. 文件清单
| 文件 | 作用 |
|---|---|
deploy.sh | 构建 → 推送 → nginx header 提示 → IndexNow ping |
.vitepress/scripts/generate-sitemap.mjs | 从 dist 生成 sitemap.xml(lastmod = 文件 mtime) |
.vitepress/scripts/indexnow-ping.mjs | POST 到 api.indexnow.org |
public/159b4527...b69.txt | IndexNow 密钥文件(部署到 web root) |
audit-ssg.cjs | 一次性诊断:检查 SSG 预渲染覆盖率 |
audit-sitemap.cjs | 一次性诊断:检查 sitemap 覆盖率 + lastmod 新鲜度 |