$岩山科技(SZ002195)$ 岩山科技的投资概念非常多,先扒一下YAN模型。
在当今的人工智能领域,大型语言模型正成为研究和商业应用的热点。这些模型以其惊人的语言理解和生成能力改变了技术景观。目前,市场上主流的大型语言模型包括OpenAI的GPT系列、Meta的LLaMa系列和Google的PaLM系列,它们都基于一种被称为Transformer的架构。Transformer架构由于其独特的自注意力机制,能够高效处理长距离的依赖关系,因此在自然语言处理(NLP)领域取得了巨大成功。
岩芯数智最近发布的YAN大模型代表了AI领域的一次重要创新,它采用了非Transformer架构,旨在解决现有Transformer模型面临的一系列挑战,如高算力消耗、训练和推理效率低下等问题。YAN模型的开发创造了这一全新的架构,期望它能成为AI领域的一项基础设施,并推动开发者生态的建设。在AI算力发展方向上看要么沿着Transformer架构跟在发达公司后面拾人牙慧,要么沿着非Transformer架构另辟蹊径做第一个吃螃蟹的大胆创新。
岩芯数智刘凡平相信,一定会有一个新的架构出现,来替代Transformer架构,这也遵循了客观规律。
《Attention is All You Need》作者Aidan Gomez今年4月曾抛出类似的观点,这个世界需要比Transformer更好的架构,我们所有人都希望它能被某种新架构所取代,将我们带到一个新的性能高原。现在,我们使用了过多的计算资源,也做了很多无用的计算。
为什么说传统Transformer架构大模型并不是AGI的最优解呢?刘凡平解释道,虽然市面上大部分模型都具备理解表达能力,但几乎还没有选择遗忘和自主学习的能力。
“选择遗忘”指向的是AI模型的动态筛选、更新信息的能力,使其和人类大脑一样,在真实的物理世界中保持活跃的状态。
而群体智能单元大模型兼具这3项核心能力,底层逻辑更类人脑,也更接近AGI。
岩芯数智CEO刘凡平用蚂蚁群、狼群、大雁群的生存法则,来类比Yan1.3群体智能单元大模型去中心化的工作原理。
论如何激发机器智能的群体智能,岩芯数智方面认为需要同时满足以下3点:
1、搭载了具备自主学习能力的若干智能单元;
2、这些分散的智能单元,可以通过环境感知、自我组织和互动协作,共同解决复杂问题;
3、并且要在不断变化的环境中,实现整体智能提升。
最新感悟:近日英伟达推出的一种用于图形处理芯片和人工智能计算的技术架构,主要应用于硬件领域,如GPU的设计和制造,旨在提高芯片的性能、能效比和计算能力等,以更好地支持人工智能和图形渲染等工作负载。终端性能大大的提高。
畅想一下如果Blackwell(英伟达的架构)与Rock AI有结合匹配将会有怎样的潜力:
硬件与软件互补:Blackwell架构的GPU提供强大算力,像数据处理、模型训练与推理加速,能补足Rock AI在复杂任务处理时的性能短板。而Rock AI的轻量化、耗模型,适配Blackwell硬件,优化资源利用。
应用场景拓展:在智能终端设备,如智能机器人、智能家居设备,结合两者,既能借助Blackwell的高性能进行复杂感知与决策运算,又能利用Rock AI实现在设备端的高效运行,实现智能化功能。
技术理念契合:Blackwell追求性能提升,Rock AI专注模拟人脑机制的创新,两者结合可在人工智能技术创新上形成合力,探索新的计算与智能处理模式
以上纯为意