Skip to content

01. 调研与事实子 SOP

适用步骤:

  • Step 1 模型事实调研
  • Step 2 站内能力核对
  • Step 3 搜索意图与竞品拆解

这份子 SOP 负责回答三件事:

  1. 模型本身是什么
  2. 我们站内真实开放了什么
  3. 用户为什么会搜这页,以及竞品怎么承接

1. Step 1:模型事实调研

1.1 目标

确认模型本身是什么,不依赖竞品页猜测。

1.2 必做动作

  • 搜官方站、官方文档、官方模型卡、官方仓库
  • 搜技术报告、release notes、版本更新说明
  • 记录模型全名、别名、版本、提供方、任务类型、核心优势、局限、开源与否、自部署与否
  • 记录模型发布时间,并写一句说明:这个发布时间为什么会影响用户对模型的期待和使用场景判断

信息提取重点:

  • 发布时间:首次公开发布时间、公开 announcement 时间、是否属于较新的模型代际
  • 技术参数:参数量、架构类型、训练数据规模、上下文或 token 相关限制
  • 功能特性:支持的输入输出格式、分辨率、宽高比、时长限制、参考图或控制能力
  • 开源协议:Apache 2.0、MIT、研究许可、商用限制、权重是否公开
  • 性能指标:速度、质量、成功率、基准测试、官方或可信第三方评测数据
  • 独特卖点:与上一代、与同类竞品相比的明确差异点
  • 生态能力:是否有官方 API、官方 SDK、ComfyUI、Hugging Face、Replicate、Fal、ModelScope 等接入

1.3 必搜渠道

  1. 官方网站和文档(最高优先级)
text
site:openai.com {Model}
site:anthropic.com {Model}
site:google.com {Model}
site:google.com/ai {Model}
site:deepmind.google {Model}
{Model} official documentation
{Model} official API
{Model} official announcement
  1. 模型卡、仓库和技术平台
text
site:huggingface.co {Model}
site:github.com {Model}
site:modelscope.cn {Model}
site:replicate.com {Model}
site:fal.ai {Model}
site:civitai.com {Model}
{Model} model card
{Model} GitHub
{Model} Hugging Face
{Model} ModelScope
  1. 技术规格和架构专项搜索
text
{Model} architecture parameters billion
{Model} technical specifications benchmark
{Model} benchmark evaluation
{Model} inference speed
{Model} latency
{Model} quality evaluation
{Model} vs {Competitor}
{Model} use cases applications
  1. 开源、自部署和许可专项搜索
text
{Model} Apache 2.0 MIT license
{Model} open source license
{Model} self host
{Model} self-hosted
{Model} local deployment
{Model} ComfyUI
{Model} inference on consumer GPU
  1. 标题、描述和卖点专项搜索
text
{Model} billion parameters
{Model} breakthrough innovation
{Model} use cases applications
{Model} benchmark evaluation
{Model} text-to-image
{Model} image-to-image
{Model} image editing
{Model} video generation

关键技术指标专项搜索:

text
{Model} billion parameters
{Model} architecture
{Model} technical specifications
{Model} benchmark evaluation
{Model} latency
{Model} inference speed
{Model} max resolution
{Model} license
{Model} Apache 2.0
{Model} MIT
{Model} commercial use

1.4 必须执行的搜索顺序

  1. 官方站 / 官方产品页 / 官方文档
  2. 官方 GitHub / Hugging Face / ModelScope / model card
  3. 官方 blog / release notes / technical report / paper
  4. 高可信第三方技术平台

1.5 必须执行的搜索模板

text
{Model} official
{Model} official documentation
{Model} official announcement
{Model} GitHub
{Model} Hugging Face
{Model} ModelScope
{Model} model card
{Model} technical report
{Model} release notes
{Model} new features
{Model} vs previous version
{Model} architecture
{Model} benchmark
{Model} text-to-image
{Model} image-to-image
{Model} editing

如果模型属于明确厂商,追加:

text
site:openai.com {Model}
site:google.com {Model}
site:anthropic.com {Model}
site:huggingface.co {Model}
site:github.com {Model}

如果模型属于特定任务,追加专项搜索:

图片模型:

text
{Model} text rendering
{Model} photorealistic
{Model} poster design
{Model} image-to-image
{Model} reference image
{Model} inpainting

视频模型:

text
{Model} text-to-video
{Model} image-to-video
{Model} start frame
{Model} end frame
{Model} duration
{Model} fps
{Model} camera control

编辑模型:

text
{Model} image editing
{Model} inpainting
{Model} outpainting
{Model} instruction editing
{Model} mask editing

1.6 必须记录的事实字段

  • Name
  • Alternate names
  • Version
  • Provider
  • Official links
  • Task types
  • Core strengths
  • Known limitations
  • Open-source
  • Self-hostable
  • Community ecosystem

可选但应尽量补齐的字段:

  • Parameters
  • Architecture
  • License
  • Benchmark notes
  • Difference from previous version

1.7 必须遵循的规则

  • 竞品页不能作为模型事实真值
  • 搜索摘要不能作为事实真值
  • 社媒帖子不能作为模型事实真值
  • 重要结论必须有官方或高可信来源
  • 重要技术结论不能只靠单一第三方来源
  • 未确认的信息只能记为“待验证”,不能写成结论

必须验证的高风险信息:

  • 参数量
  • 架构类型
  • 许可证
  • 自部署能力
  • 与竞品的优劣结论
  • 速度、成本、质量优势

这些信息至少满足其一才能写进 facts sheet:

  • 官方文档直接说明
  • 官方仓库 / model card 直接说明
  • 两类高可信来源相互印证

事实提取硬规则:

  • 每个重点信息块至少提取 1 条“可直接写入页面”的结论
  • 每个结论必须能回答“这条信息将进入页面哪个模块”
  • 如果搜索结果只有营销描述,没有技术信息,继续搜,不允许提前结束
  • 如果官方没有写清楚许可、参数、限制,就明确记录“未公开”,不能猜
  • 如果第三方说法和官方说法冲突,优先记录冲突,禁止自行拍板

关键技术指标验证规则:

  • 如果官方文档、官方模型卡、官方仓库 README、官方技术报告明确写出某个参数或技术规格,则该信息可以直接作为事实写入 facts sheet,不再要求三方验证。
  • 第三方来源此时只用于:
    • 补充解释
    • 帮助理解
    • 验证自己是否误读官方表述
  • 不允许用第三方说法去覆盖官方已经明确写出的参数。
  • 以下信息在“官方没有明确写出”时,默认追求至少 3 个独立来源确认:
    • 参数量
    • 架构
    • 分辨率或时长上限
    • 速度或延迟
    • 许可证
    • 独特功能
  • 如果官方没有明确写出,且无法达到 3 个独立来源,至少满足:
    • 1 个官方来源
    • 1 个高可信技术来源或平台镜像
    • 并在 source-log.md 明确记录“为什么无法三方验证”
  • 没有达到上述条件,不得把该指标写成确定事实

禁止事项:

  • 未经验证的技术声明
  • 凭想象添加功能特性
  • 夸大性能和能力
  • 复制其他模型的虚假内容
  • 没有来源的数据和指标

提取完成前必须回答:

  • 这个模型最明确的技术标签是什么
  • 这个模型最明确的 3 个应用场景是什么
  • 这个模型与站内其他模型相比最明显的差异是什么
  • 这个模型有哪些信息不能写进页面,因为没有可信来源

1.8 产出物

  • model-facts.md
  • source-log.md

固定产出模板:

md
## Model facts

- Name:
- Alternate names:
- Version:
- Provider:
- Official links:
- Task types:
- Core strengths:
- Known limitations:
- Open-source:
- Self-hostable:
- Community ecosystem:
md
## Source log

- Fact:
  Source:
  Type: official site / model card / repo / paper / third-party
  Reason for trust:
  Verification status:

1.9 进入下一步条件

  • 模型基础事实已记录
  • 至少有可追溯来源
  • 没有关键事实处于“猜测中”
  • model-facts.mdsource-log.md 已成文

2. Step 2:站内能力核对

2.1 目标

把“模型本身能做什么”和“我们站内现在开放了什么”分开。

2.2 必做动作

  • 对照本地 config
  • 核对支持的工作流、比例、参考图、分辨率、限制项
  • 标出可写、不可写、需降级表述的能力

固定核对字段:

  • text-to-image
  • image-to-image
  • editing
  • supported aspect ratios
  • supported resolutions
  • reference image count
  • prompt length
  • membership gate
  • credits
  • NSFW
  • web search

2.3 必须遵循的规则

  • 页面落地能力只认站内 config
  • credits、会员门槛、促销规则不写进静态模型介绍
  • 外部资料与本地 config 冲突时,以本地 config 为准

2.4 产出物

  • config-crosscheck.md

固定模板:

md
## Config crosscheck

- Capability:
  Upstream says:
  Our config says:
  Final page wording:
  Status: allowed / disallowed / downgrade

2.5 进入下一步条件

  • 已明确页面里哪些能力能写
  • 已明确哪些能力绝对不能写

3. Step 3:搜索意图与竞品拆解

3.1 目标

明确这页要承接哪些搜索意图,以及竞品怎么组织页面。

3.2 必做动作

  • 至少看 3 个竞品页
  • 记录 title、H1、首屏副标题、模块顺序、FAQ、CTA
  • 提炼主关键词、次关键词、场景词、决策词

竞品记录模板:

md
## Competitor teardown

### Page 1
- URL:
- Title:
- H1:
- Hero subtitle:
- Section order:
- FAQ topics:
- CTA:
- What to learn:
- What not to copy:

intent map 模板:

md
## Intent map

- Primary keyword:
- Secondary keywords:
- Use-case keywords:
- Decision keywords:

3.3 必须遵循的规则

  • 不抄竞品文案
  • 竞品用于学结构和意图,不用于学事实
  • 主任务词必须明确

3.4 产出物

  • competitor-teardown.md
  • intent-map.md
  • 如已核实外部 benchmark 页,也要写入 competitor-teardown.md

3.5 进入下一步条件

  • 已明确页面的主任务词
  • 已明确页面要回答哪些问题

Released under the MIT License.