医嘱信息提取系统2 - 题解

一、题目分析

本题要求从医嘱文本中解析用药信息，输出嵌套JSON：

涉及药品分类判定、分段给药计算、整板发药三个核心计算模块。

"总共X天" vs "再吃X天"语义差异：这是本题最大陷阱。"总共7天"中首剂占第1天，需减1；"再吃7天"是额外天数，不需要减。LLM极易混淆两者。
抗生素关键词的子串匹配：阿莫西林含"西林"是抗生素，但阿司匹林含"匹林"不含"西林"，不是抗生素。模型容易做模糊匹配。
优先级覆盖标记：当药名同时含抗生素和缓控释关键词时，分类按抗生素（pack_size=6），但需额外标记is_priority_override=true。这是一个容易遗漏的联动字段。
多段给药的累加计算：如"前2天2片qd + 之后1片qd再吃7天"，需要正确识别分段边界并分别计算再求和。

这是prompt设计的核心。用两组对比示例直接展示差异：

通过正确答案+错误答案对比，让模型建立正确的语义映射。

逐一列出4个关键词（霉素/沙星/头孢/西林），并用注释标注易混淆项：

覆盖所有关键场景：

将qd/bid/tid/qid/qn的频次映射集中呈现，避免模型在计算时猜测频次含义。