Skip to content

搜索引擎索引提交清单 (Indexing Checklist)

目标: 让 Google、Bing、百度、搜狗及 AI 平台(ChatGPT search、Perplexity、Gemini、Grok)能发现并索引 gptpluszh.com 全部 79 页内容。


1. VitePress SSG 已验证 ✅

所有 80 个 HTML 页面(含 404)在 vitepress build 后都已在 <div id="app"> 内完整预渲染为静态 HTML,零 SPA-only 页面。搜索引擎爬虫无需执行 JavaScript 即可看到全部正文、导航、结构化数据。

验证命令:

bash
npm run docs:build
node audit-ssg.cjs          # 输出 Top / Bottom 页面内容量
node audit-sitemap.cjs      # 输出 sitemap URL 覆盖率

2. Google Search Console — 提交 sitemap(立即执行)

2.1 验证站点所有权

如果尚未验证,用以下任一方式:

  • DNS TXT 记录(推荐,覆盖全站 + 子域名):GSC 提供值 → 加到 DNS 的 TXT 记录
  • HTML 文件:下载 GSC 提供的 googleXXXX.html → 放到 public/ 目录 → 重新 bash deploy.sh

2.2 提交 sitemap

  1. 登录 Google Search Console
  2. 选择属性 gptpluszh.com(或 https://gptpluszh.com
  3. 左侧导航 → Sitemaps → 输入 sitemap.xml → 点击 提交
  4. 预期:显示 "已成功提交" + 处理中的 URL 数量(79 页)

2.3 提交 IndexNow(已自动化)

deploy.sh 每次部署自动调用 indexnow-ping.mjs,向 api.indexnow.org 提交前 1000 条 sitemap URL。Google 已加入 IndexNow 协议,Bing/Yandex/Seznam 均支持。

2.4 48–72 小时后验证

site:gptpluszh.com

在 Google / Bing 搜索框输入上述命令,预期看到 ≥ 50 页被索引。若结果 < 10,检查 GSC → 页面 → 未被编入索引的页面 → 查看具体原因(已抓取-尚未编入索引 是正常的短期状态)。


3. Bing Webmaster Tools — 提交 sitemap(立即执行)

3.1 导入站点(如尚未验证)

  1. 登录 Bing Webmaster Tools
  2. 点击 添加网站 → 输入 https://gptpluszh.com
  3. 如果已有 GSC 验证,可直接 从 GSC 导入 跳过二次验证
  4. 否则用 DNS TXT / XML 文件 验证

3.2 提交 sitemap

  1. 左侧导航 → Sitemaps → 输入 https://gptpluszh.com/sitemap.xml → 提交
  2. IndexNow 已通过 deploy.sh 自动通知 Bing(Bing 是 IndexNow 协议发起方,优先级最高)

3.3 百度搜索资源平台(可选)

由于站点语言为 zh-Hans 且目标用户在中国大陆:

  1. 登录 百度搜索资源平台
  2. 站点验证 → sitemap 提交 https://gptpluszh.com/sitemap.xml
  3. 百度不参与 IndexNow 协议,需通过百度自己的 API 提交

4. 其他搜索引擎(按需)

搜索引擎sitemap 提交地址备注
搜狗搜狗站长平台中文搜索次要来源
Yandexwebmaster.yandex.comIndexNow 已自动通知
Seznamsearch.seznam.czIndexNow 已自动通知(捷克)

5. AI 引擎发现(被动,无需提交)

AI 爬虫通过以下方式发现本站:

平台发现方式状态
ChatGPT searchOpenAI 整合 Bing 索引IndexNow (Bing) ✅
Perplexity AIPerplexityBot 爬虫 + Bing 索引IndexNow ✅
Google Gemini直接读 Google 索引sitemap ✅
Grok (xAI)整合 Bing 索引 + Twitter 链OG/Twitter card ✅
Claude.ai未接外部搜索;需主动提交 llms.txtpublic/llms.txt

重要: AI 爬虫的发现依赖传统搜索引擎索引 — 先索引,后 AI 发现。不需要(也无法)向 AI 平台直接提交。


6. 问题排查

sitemap 提交失败

bash
# 本地验证 sitemap 格式
curl -s https://gptpluszh.com/sitemap.xml | head -20

# 确认 robots.txt 链接正确
curl -s https://gptpluszh.com/robots.txt

页面 "已抓取-尚未编入索引"

  • 正常状态,Google 需要 1–3 天评估页面质量
  • 确保页面有 ≥ 300 字正文 + canonical 链接 + meta description
  • 如果没有改善,检查 GSC → 手动操作 → 有没有处罚

IndexNow 提交失败

  • deploy.sh 输出中的 [IndexNow] ⚠️ 行会显示错误详情
  • 确认 https://gptpluszh.com/159b452719f12074dd9818432b809e7ed3ba0fad58b0ae8405c031775c100b69.txt 可访问(返回 key 值)
  • 网络波动时会打印 non-fatal — sitemap 兜底仍然有效

7. 文件清单

文件作用
deploy.sh构建 → 推送 → nginx header 提示 → IndexNow ping
.vitepress/scripts/generate-sitemap.mjs从 dist 生成 sitemap.xml(lastmod = 文件 mtime)
.vitepress/scripts/indexnow-ping.mjsPOST 到 api.indexnow.org
public/159b4527...b69.txtIndexNow 密钥文件(部署到 web root)
audit-ssg.cjs一次性诊断:检查 SSG 预渲染覆盖率
audit-sitemap.cjs一次性诊断:检查 sitemap 覆盖率 + lastmod 新鲜度

Released under the MIT License.