我们的内容、方法论和 benchmark 体系必须独立运行。
评价标准由研究框架决定,而不是由厂商需求决定。
每个分数都应能追溯到测试输入、证据记录或公开产品事实。
评测应同时呈现优势与限制,并清楚区分事实、解释与判断。