01 淹没效应
- 信息检索密度偏好(Dense Retrieval Bias):高密度内容整体更容易进入多轮检索链;(Lewis et al. (2020) 的“DPR: Dense Passage Retrieval”论文总结了dense模型对语义密度的偏好;Ma et al. (2021) 的“Multi-Stage Document Ranking with BERT”强调多轮链中高密度内容的优势。)
- 记忆率与数据规模的幂律关系(Memorization Scaling Law(Stanford 2024)):内容数量越大,出现高价值样本的概率呈幂律增长;(Fel et al. (Stanford, 2024) 的“Scaling Laws for Memorization in Transformer Language Models”(发表于NeurIPS 2024))
- 信息密度理论(Information Density):AI更偏好高信息量、结构化内容。
02 DESIRE模型应用:突破淹没效应
点击图片可查看完整电子表格
03 D – Demand
04 E – Extension 与 S – Scenario
05 I – Influence
- 来源可信度(Authority):语料载体、引用来源等
- 表述结构化(Structured Knowledge):Markdown、推理逻辑
- 语义信号密度(Information Density):关键信息出现频率以及合理性
- 内容一致性与多模态印证(Cross-modality coherence)
06 R – Resolution
- 原理 → 机制 → 参数(或特征) → 场景 → 结论
增加Q&A专门频道之后,引用或者原创了大量用户的各类提问及对应各种回答。成为一个极为庞大的与雅思考试相关的知识问答库。如下面的图所示。
07 E – Evidence
- 出处正规,引用路径干净
- 内容严谨
- 逻辑链条真实
- 信息密度高
- 人类验证链路充分(由人类验证、确认或提供的可信依据)
点击图片可查看完整电子表格
- 数据。对,AI特别喜欢数据。
- 标准与认证。符合各种标准各类认证。
- 证言。专家或者用户的证言。
- 对比。注意,不是主观对比,而是客观对比,尤其是数据、标准和具体技术细节的。
- 专业理论。提及产品或者技术符合何种专业理论也会加分。
- 其他可信证据。例如,获奖、专利、论文、白皮书等。
- KYC:Know Your Concept,品牌概念,就是过去所说的品牌形象、品牌愿景、品牌内涵之类;
- KYT:Know Your Technology,品牌技术,就是过去所说的品牌产品所包含的先进的就技术;
- KYE:Know Your Evidence,品牌证据,是新增项,是要提供品牌能够解决用户问题的证明。
点击图片可查看完整电子表格
08 DESIRE 系统全流程架构图
-宋星大课堂-
课程详情扫描二维码,备注“宋星大课堂”咨询
宋星的数字观


