2024 年 4 月 18 日星期四, Meta 宣布推出 Llama 3,这是其Llama 系列 大型语言模型 (LLM)的最新版本。去年,Llama 2 作为最强大的 LLM 之一而备受关注。此后,OpenAI 的 GPT-4 和 Anthropic 的 Claude 3 等竞争对手的快速进步意味着 Llama 2 已跌出 Chatbot Arena上 LLM 性能排名前 30 名。Llama 3 能重夺桂冠吗?
想要开始使用生成式人工智能吗?
了解如何在浏览器中使用 Python 中的 LLM
什么是 Llama 3?
Llama 3 是一款文本生成 AI。也就是说,与 Op 土耳其赌博数据 enAI 的 GPT 和 Anthropic 的 Claude 模型类似,您可以编写文本提示,然后它会生成文本响应。最新模型有望提高性能,特别是在更好的上下文理解和逻辑推理方面。Llama 模型用于为 Instagram、WhatsApp、Messenger 和 Facebook 中包含的智能助手 Meta AI 提供支持。
Llama 3 是一个“开放权重”模型。这意味着模型本身是开源的,提供了有关其计算方式的一些透明度。不过,重建它的完整细节(例如用于训练它的数据集)尚未公开。
使用 MidjourneyPrompt 制作的 3 只骆驼图片,主题为“3 只骆驼在田野里快乐嬉戏的卡通画”
Llama3 的新功能
Llama 3 有两种大小:80 亿参数模型和 700 亿参数模型。一般来说,参数越多,输出质量越好,但模型运行速度越慢,成本越高。700 亿参数与许多竞争对手的模型相当,尽管有些著名模型的参数大小甚至更大。据宣布,第三种更大的模型正在开发中,其参数为 4000 亿。
上下文窗口(一次可以推理的文本量)已从 4096 个标记增加到 8192 个标记。标记指的是单个单词或标点符号,但有些单词被分解为多个标记。在英语中,四个标记大约相当于三个单词,因此新的上下文窗口大约相当于 15 页文本(每页 400 个单词)。虽然这一增长值得欢迎,但它仍远未达到最前沿,Claude 3 模型提供的上下文窗口为 200,000 个标记。
公告文章并未描述该模型的更多功能。相反,大部分焦点都集中在周围的软件生态系统上。
Llama 3 生态系统
在发布 Llama3 的同时,Meta 还发布了一套工具,让 Llama 的使用更加轻松、安全。以下是概述。
骆驼守卫 2
Llama Guard 2是一款 LLM 工具,用于将文本分类为“安全”或“不安全”。它既可用于提示,也可用于响应。例如,它可以检测文本是否包含暴力、仇恨言论或其他令人反感的内容的描述。
一个示例用例是聊天机器人。您可以检查每个提示,如果内容被标记为不安全,则提供警告或处理有问题内容的其他方法。同样,如果聊天机器人生成标记为不安全的响应,您可以在用户看到它之前拦截它并重试。
除了安全/不安全标志之外,Llama Guard 2 的回应还带有安全标签——这是MLCommons AI 安全分类法中十一类令人不快的内容之一。
骆驼代码盾
Llama Code Shield将代码分为安全代码和不安全代码。许多软件开发人员使用 LLM 来协助编写代码,因此存在生成不安全代码并将其纳入生产的风险。该工具旨在整合到 AI 编码助手中,并集成到 VSCode 和 DataLab 等其他工具中。
什么是 Llama 3?专家对下一代开源 LLM 的看法
-
- Posts: 317
- Joined: Mon Dec 23, 2024 5:02 am