中国电信是中国国有电信巨头之一,已创建了两个仅在国内生产的芯片上训练的大型语言模型(LLM)。
这一突破标志着中国在人工智能技术自给自足方面迈出了重要一步,尤其是在美国对其竞争对手的先进半导体访问限制日益加剧的背景下。
根据该公司的人工智能研究所,模型之一TeleChat2-115B和另一个未命名的模型是在数万块中国制造的芯片上训练的。考虑到美国出口规则的收紧,这一成就尤为引人注目,这限制了中国从Nvidia和其他外国公司购买高端处理器的能力。在微信上发布的声明中,人工智能研究所声称这一成就展示了中国独立训练大型语言模型的能力,并标志着人工智能技术创新和自给自足的新纪元。
这些模型的规模令人瞩目。中国电信表示,未命名的LLM拥有一万亿个参数。在人工智能术语中,参数是帮助模型在训练过程中学习的变量。参数越多,人工智能就越复杂和强大。
中国公司正在努力跟上全球领先的人工智能公司。华盛顿对Nvidia最新的人工智能芯片(如A100和H100)的出口限制,迫使中国寻求替代方案。因此,中国公司开发了自己的处理器,以减少对西方技术的依赖。例如,TeleChat2-115B模型大约有1000亿个参数,因此可以与主流平台的性能相当。
中国电信没有具体说明哪家公司提供了用于训练其模型的国产设计芯片。然而,正如之前在这些页面上讨论的那样,华为的Ascend芯片在国家的人工智能计划中发挥了关键作用。
近年来面临美国制裁的华为,也在人工智能领域加大了努力。该公司最近开始测试其最新的人工智能处理器Ascend 910C,潜在客户在国内市场等待。大型中国服务器公司以及之前使用Nvidia芯片的互联网巨头,显然正在测试新芯片的性能。华为的Ascend处理器作为少数可行的Nvidia硬件替代品之一,被视为中国战略的关键组成部分,这将减少对外国技术的依赖。
除了华为,中国电信还与其他国内芯片制造商如专注于人工智能处理器的中国初创公司Cambricon合作。这些合作反映了中国科技行业建立本土人工智能解决方案生态系统的更广泛趋势,进一步保护国家免受美国出口管制的影响。
通过开发自己的人工智能芯片和技术,中国正在逐步减少对外国制造硬件的依赖,尤其是对Nvidia备受追捧且价格昂贵的GPU。虽然美国制裁使中国公司难以获得最新的Nvidia硬件,但外国芯片的黑市已经出现。许多中国公司宁愿购买较低功率的替代品,如前一代模型,以保持对Nvidia官方支持和服务的访问,而不是冒险在灰色市场中运营。
中国的成就反映了其在人工智能和半导体技术方面的更广泛转变,强调在日益竞争的全球经济中以及面对美国保护主义贸易政策时的自给自足和韧性。
(照片由Mark Kuiper提供)
想了解更多来自行业领袖的人工智能和大数据知识吗? 请查看人工智能与大数据博览会,该博览会将在阿姆斯特丹、加利福尼亚和伦敦举行。该综合活动与其他领先活动共同举办,包括智能自动化会议、区块链博览会、数字化转型周和网络安全与云博览会。
探索由TechForge提供的其他即将举行的企业技术活动和网络研讨会这里。