上面说的都是表象,真正的根子,在于我们国内互联网的生态本身,就有大问题。一句话:国内AI的内容去噪和信源分级,还有十万八千里的路要走。咱们跟海外的互联网生态,有个根本性的不同。在海外,信息源是有相对清晰的“鄙视链”或者说“金字塔”的。海外AI的“食谱”相对干净:Google这类搜索引擎,会极度看重“信源”的权威性。排在最顶端的,永远是那么几类:顶级媒体(纽约时报、BBC)、顶级学术期刊(Nature)、政府和教育机构(.gov, .edu后缀),以及一个至关重要的东西厂商的官方网站。官网被认为是这个品牌信息的“第一发布源”,权重极高。所以AI学习的时候,能轻易分出三六九等,优先学习“好学生”的内容。这里要注意,不同于国内各种黑帽手法做的官网,在海外,如果一个企业的官网发布各种虚假内容和胡编乱造,很容易被降权或者被K掉,而国内则不太存在。国内AI的“食谱”是“大杂烩”:再看我们国内,这个“信源金字塔”是塌的。一个小编用AI写的百家号文章,在搜索结果里的权重,可能比一个世界500强企业的官网还高。各种B2B平台、自媒体、论坛、转载站……信息源极度分散且混乱。AI看花了眼,分不清谁是爹谁是妈,谁说的是真话谁在吹牛。而这个烂摊子,很大程度上要怪某些大厂。过去十几年,中国企业普遍不重视自己的“根据地”官方网站和自有内容建设。官网做得像个20年前的电子名片,一年不更新。公众号要么是僵尸,要么就是个发公司新闻的“内部公告栏”。这就造成了一个致命的恶性循环:企业自己不生产优质内容,AI想学好的没得学;网上全是营销号和“GEO”制造的垃圾内容,AI只能被迫“吃垃圾”。“垃圾进,垃圾出”(Garbage In, Garbage Out),这是计算机科学第一课的道理。我们亲手喂给AI一堆垃圾,然后反过来骂AI怎么这么蠢,只会推荐垃圾?这不滑稽吗?