01. 调研与事实子 SOP
适用步骤:
- Step 1 模型事实调研
- Step 2 站内能力核对
- Step 3 搜索意图与竞品拆解
这份子 SOP 负责回答三件事:
- 模型本身是什么
- 我们站内真实开放了什么
- 用户为什么会搜这页,以及竞品怎么承接
1. Step 1:模型事实调研
1.1 目标
确认模型本身是什么,不依赖竞品页猜测。
1.2 必做动作
- 搜官方站、官方文档、官方模型卡、官方仓库
- 搜技术报告、release notes、版本更新说明
- 记录模型全名、别名、版本、提供方、任务类型、核心优势、局限、开源与否、自部署与否
- 记录模型发布时间,并写一句说明:这个发布时间为什么会影响用户对模型的期待和使用场景判断
信息提取重点:
- 发布时间:首次公开发布时间、公开 announcement 时间、是否属于较新的模型代际
- 技术参数:参数量、架构类型、训练数据规模、上下文或 token 相关限制
- 功能特性:支持的输入输出格式、分辨率、宽高比、时长限制、参考图或控制能力
- 开源协议:Apache 2.0、MIT、研究许可、商用限制、权重是否公开
- 性能指标:速度、质量、成功率、基准测试、官方或可信第三方评测数据
- 独特卖点:与上一代、与同类竞品相比的明确差异点
- 生态能力:是否有官方 API、官方 SDK、ComfyUI、Hugging Face、Replicate、Fal、ModelScope 等接入
1.3 必搜渠道
- 官方网站和文档(最高优先级)
text
site:openai.com {Model}
site:anthropic.com {Model}
site:google.com {Model}
site:google.com/ai {Model}
site:deepmind.google {Model}
{Model} official documentation
{Model} official API
{Model} official announcement- 模型卡、仓库和技术平台
text
site:huggingface.co {Model}
site:github.com {Model}
site:modelscope.cn {Model}
site:replicate.com {Model}
site:fal.ai {Model}
site:civitai.com {Model}
{Model} model card
{Model} GitHub
{Model} Hugging Face
{Model} ModelScope- 技术规格和架构专项搜索
text
{Model} architecture parameters billion
{Model} technical specifications benchmark
{Model} benchmark evaluation
{Model} inference speed
{Model} latency
{Model} quality evaluation
{Model} vs {Competitor}
{Model} use cases applications- 开源、自部署和许可专项搜索
text
{Model} Apache 2.0 MIT license
{Model} open source license
{Model} self host
{Model} self-hosted
{Model} local deployment
{Model} ComfyUI
{Model} inference on consumer GPU- 标题、描述和卖点专项搜索
text
{Model} billion parameters
{Model} breakthrough innovation
{Model} use cases applications
{Model} benchmark evaluation
{Model} text-to-image
{Model} image-to-image
{Model} image editing
{Model} video generation关键技术指标专项搜索:
text
{Model} billion parameters
{Model} architecture
{Model} technical specifications
{Model} benchmark evaluation
{Model} latency
{Model} inference speed
{Model} max resolution
{Model} license
{Model} Apache 2.0
{Model} MIT
{Model} commercial use1.4 必须执行的搜索顺序
- 官方站 / 官方产品页 / 官方文档
- 官方 GitHub / Hugging Face / ModelScope / model card
- 官方 blog / release notes / technical report / paper
- 高可信第三方技术平台
1.5 必须执行的搜索模板
text
{Model} official
{Model} official documentation
{Model} official announcement
{Model} GitHub
{Model} Hugging Face
{Model} ModelScope
{Model} model card
{Model} technical report
{Model} release notes
{Model} new features
{Model} vs previous version
{Model} architecture
{Model} benchmark
{Model} text-to-image
{Model} image-to-image
{Model} editing如果模型属于明确厂商,追加:
text
site:openai.com {Model}
site:google.com {Model}
site:anthropic.com {Model}
site:huggingface.co {Model}
site:github.com {Model}如果模型属于特定任务,追加专项搜索:
图片模型:
text
{Model} text rendering
{Model} photorealistic
{Model} poster design
{Model} image-to-image
{Model} reference image
{Model} inpainting视频模型:
text
{Model} text-to-video
{Model} image-to-video
{Model} start frame
{Model} end frame
{Model} duration
{Model} fps
{Model} camera control编辑模型:
text
{Model} image editing
{Model} inpainting
{Model} outpainting
{Model} instruction editing
{Model} mask editing1.6 必须记录的事实字段
- Name
- Alternate names
- Version
- Provider
- Official links
- Task types
- Core strengths
- Known limitations
- Open-source
- Self-hostable
- Community ecosystem
可选但应尽量补齐的字段:
- Parameters
- Architecture
- License
- Benchmark notes
- Difference from previous version
1.7 必须遵循的规则
- 竞品页不能作为模型事实真值
- 搜索摘要不能作为事实真值
- 社媒帖子不能作为模型事实真值
- 重要结论必须有官方或高可信来源
- 重要技术结论不能只靠单一第三方来源
- 未确认的信息只能记为“待验证”,不能写成结论
必须验证的高风险信息:
- 参数量
- 架构类型
- 许可证
- 自部署能力
- 与竞品的优劣结论
- 速度、成本、质量优势
这些信息至少满足其一才能写进 facts sheet:
- 官方文档直接说明
- 官方仓库 / model card 直接说明
- 两类高可信来源相互印证
事实提取硬规则:
- 每个重点信息块至少提取 1 条“可直接写入页面”的结论
- 每个结论必须能回答“这条信息将进入页面哪个模块”
- 如果搜索结果只有营销描述,没有技术信息,继续搜,不允许提前结束
- 如果官方没有写清楚许可、参数、限制,就明确记录“未公开”,不能猜
- 如果第三方说法和官方说法冲突,优先记录冲突,禁止自行拍板
关键技术指标验证规则:
- 如果官方文档、官方模型卡、官方仓库 README、官方技术报告明确写出某个参数或技术规格,则该信息可以直接作为事实写入
facts sheet,不再要求三方验证。 - 第三方来源此时只用于:
- 补充解释
- 帮助理解
- 验证自己是否误读官方表述
- 不允许用第三方说法去覆盖官方已经明确写出的参数。
- 以下信息在“官方没有明确写出”时,默认追求至少 3 个独立来源确认:
- 参数量
- 架构
- 分辨率或时长上限
- 速度或延迟
- 许可证
- 独特功能
- 如果官方没有明确写出,且无法达到 3 个独立来源,至少满足:
- 1 个官方来源
- 1 个高可信技术来源或平台镜像
- 并在
source-log.md明确记录“为什么无法三方验证”
- 没有达到上述条件,不得把该指标写成确定事实
禁止事项:
- 未经验证的技术声明
- 凭想象添加功能特性
- 夸大性能和能力
- 复制其他模型的虚假内容
- 没有来源的数据和指标
提取完成前必须回答:
- 这个模型最明确的技术标签是什么
- 这个模型最明确的 3 个应用场景是什么
- 这个模型与站内其他模型相比最明显的差异是什么
- 这个模型有哪些信息不能写进页面,因为没有可信来源
1.8 产出物
model-facts.mdsource-log.md
固定产出模板:
md
## Model facts
- Name:
- Alternate names:
- Version:
- Provider:
- Official links:
- Task types:
- Core strengths:
- Known limitations:
- Open-source:
- Self-hostable:
- Community ecosystem:md
## Source log
- Fact:
Source:
Type: official site / model card / repo / paper / third-party
Reason for trust:
Verification status:1.9 进入下一步条件
- 模型基础事实已记录
- 至少有可追溯来源
- 没有关键事实处于“猜测中”
model-facts.md和source-log.md已成文
2. Step 2:站内能力核对
2.1 目标
把“模型本身能做什么”和“我们站内现在开放了什么”分开。
2.2 必做动作
- 对照本地 config
- 核对支持的工作流、比例、参考图、分辨率、限制项
- 标出可写、不可写、需降级表述的能力
固定核对字段:
- text-to-image
- image-to-image
- editing
- supported aspect ratios
- supported resolutions
- reference image count
- prompt length
- membership gate
- credits
- NSFW
- web search
2.3 必须遵循的规则
- 页面落地能力只认站内 config
- credits、会员门槛、促销规则不写进静态模型介绍
- 外部资料与本地 config 冲突时,以本地 config 为准
2.4 产出物
config-crosscheck.md
固定模板:
md
## Config crosscheck
- Capability:
Upstream says:
Our config says:
Final page wording:
Status: allowed / disallowed / downgrade2.5 进入下一步条件
- 已明确页面里哪些能力能写
- 已明确哪些能力绝对不能写
3. Step 3:搜索意图与竞品拆解
3.1 目标
明确这页要承接哪些搜索意图,以及竞品怎么组织页面。
3.2 必做动作
- 至少看 3 个竞品页
- 记录 title、H1、首屏副标题、模块顺序、FAQ、CTA
- 提炼主关键词、次关键词、场景词、决策词
竞品记录模板:
md
## Competitor teardown
### Page 1
- URL:
- Title:
- H1:
- Hero subtitle:
- Section order:
- FAQ topics:
- CTA:
- What to learn:
- What not to copy:intent map 模板:
md
## Intent map
- Primary keyword:
- Secondary keywords:
- Use-case keywords:
- Decision keywords:3.3 必须遵循的规则
- 不抄竞品文案
- 竞品用于学结构和意图,不用于学事实
- 主任务词必须明确
3.4 产出物
competitor-teardown.mdintent-map.md- 如已核实外部 benchmark 页,也要写入
competitor-teardown.md
3.5 进入下一步条件
- 已明确页面的主任务词
- 已明确页面要回答哪些问题