单纯从技术层面时至今日国内没有哪个团队处于绝对领先位置。
Posted: Mon Apr 21, 2025 3:52 am
大模型有大要素:算法、数据、算力国内厂商们过去直在啃算法大家发布模型本质上是发布套算法和系统。大家比拼谁的算法更先进谁的模型参数更大推理效率更高。
但现在越来越多从业者发现算法其实没有壁垒。陈冉更是直言大模型不值钱。 我认企业级的 新西兰 whatsapp 筛查 大模型没意义开源企业级就行了因为最重要的是数据。他说。 数据是比算法更稀缺的资源。算法可以通过修改开源模型和人海战术迭代算力可以通过砸钱买卡获得但优质的数据没有渠道售卖花钱不定能买来。
训练模型跟训练学生类似数据相当于教材或教育资源过程就叫预训练。偏远山区的孩子和线城市的孩子从小获得的教育资源不同训练过程不同最后高考考上重点大学的概率也必然不同。某种意义上拥有优质数据预训练就成功了半。
过去年行业里评估个大模型好坏的标准是通过测评相当于考试。既然是考试就有作弊的空间或者可以通过刷题得高分。这就导致很多大模型其实是应试教育的产物——参数大、得分高、性能强但没啥实践能力。
李友峰认为算法有很大局限性如果脱离具体的应用场景算法没有意义。
但现在越来越多从业者发现算法其实没有壁垒。陈冉更是直言大模型不值钱。 我认企业级的 新西兰 whatsapp 筛查 大模型没意义开源企业级就行了因为最重要的是数据。他说。 数据是比算法更稀缺的资源。算法可以通过修改开源模型和人海战术迭代算力可以通过砸钱买卡获得但优质的数据没有渠道售卖花钱不定能买来。
训练模型跟训练学生类似数据相当于教材或教育资源过程就叫预训练。偏远山区的孩子和线城市的孩子从小获得的教育资源不同训练过程不同最后高考考上重点大学的概率也必然不同。某种意义上拥有优质数据预训练就成功了半。
过去年行业里评估个大模型好坏的标准是通过测评相当于考试。既然是考试就有作弊的空间或者可以通过刷题得高分。这就导致很多大模型其实是应试教育的产物——参数大、得分高、性能强但没啥实践能力。
李友峰认为算法有很大局限性如果脱离具体的应用场景算法没有意义。