什么是 Llama 3？专家对下一代开源 LLM 的看法

mostakimvip06 · Post by **mostakimvip06** » Tue Mar 18, 2025 5:26 am

2024 年 4 月 18 日星期四， Meta 宣布推出 Llama 3，这是其Llama 系列大型语言模型 (LLM)的最新版本。去年，Llama 2 作为最强大的 LLM 之一而备受关注。此后，OpenAI 的 GPT-4 和 Anthropic 的 Claude 3 等竞争对手的快速进步意味着 Llama 2 已跌出 Chatbot Arena上 LLM 性能排名前 30 名。Llama 3 能重夺桂冠吗？

想要开始使用生成式人工智能吗？
了解如何在浏览器中使用 Python 中的 LLM

什么是 Llama 3？
Llama 3 是一款文本生成 AI。也就是说，与 Op 土耳其赌博数据 enAI 的 GPT 和 Anthropic 的 Claude 模型类似，您可以编写文本提示，然后它会生成文本响应。最新模型有望提高性能，特别是在更好的上下文理解和逻辑推理方面。Llama 模型用于为 Instagram、WhatsApp、Messenger 和 Facebook 中包含的智能助手 Meta AI 提供支持。

Llama 3 是一个“开放权重”模型。这意味着模型本身是开源的，提供了有关其计算方式的一些透明度。不过，重建它的完整细节（例如用于训练它的数据集）尚未公开。

使用 MidjourneyPrompt 制作的 3 只骆驼图片，主题为“3 只骆驼在田野里快乐嬉戏的卡通画”

Llama3 的新功能
Llama 3 有两种大小：80 亿参数模型和 700 亿参数模型。一般来说，参数越多，输出质量越好，但模型运行速度越慢，成本越高。700 亿参数与许多竞争对手的模型相当，尽管有些著名模型的参数大小甚至更大。据宣布，第三种更大的模型正在开发中，其参数为 4000 亿。

上下文窗口（一次可以推理的文本量）已从 4096 个标记增加到 8192 个标记。标记指的是单个单词或标点符号，但有些单词被分解为多个标记。在英语中，四个标记大约相当于三个单词，因此新的上下文窗口大约相当于 15 页文本（每页 400 个单词）。虽然这一增长值得欢迎，但它仍远未达到最前沿，Claude 3 模型提供的上下文窗口为 200,000 个标记。

公告文章并未描述该模型的更多功能。相反，大部分焦点都集中在周围的软件生态系统上。

Llama 3 生态系统
在发布 Llama3 的同时，Meta 还发布了一套工具，让 Llama 的使用更加轻松、安全。以下是概述。

骆驼守卫 2
Llama Guard 2是一款 LLM 工具，用于将文本分类为“安全”或“不安全”。它既可用于提示，也可用于响应。例如，它可以检测文本是否包含暴力、仇恨言论或其他令人反感的内容的描述。

一个示例用例是聊天机器人。您可以检查每个提示，如果内容被标记为不安全，则提供警告或处理有问题内容的其他方法。同样，如果聊天机器人生成标记为不安全的响应，您可以在用户看到它之前拦截它并重试。

除了安全/不安全标志之外，Llama Guard 2 的回应还带有安全标签——这是MLCommons AI 安全分类法中十一类令人不快的内容之一。

骆驼代码盾
Llama Code Shield将代码分为安全代码和不安全代码。许多软件开发人员使用 LLM 来协助编写代码，因此存在生成不安全代码并将其纳入生产的风险。该工具旨在整合到 AI 编码助手中，并集成到 VSCode 和 DataLab 等其他工具中。