--和等语言模型的k长度直在增长。截至 年月 已经支持多达K个k 。这里K代表千K。K也就是万千个k。如何去优雅又节省地给大语言模型写提示语已成为门手艺。 截至年月的 模型及其上下文长度限制给大语言模型下指令有点像往早期计算机里输入指令在键盘发明之前需要在条穿孔纸带( )上点点把指令喂给计算机。
比尔盖茨和保罗阿兰最早开始合作编程的时候就是这么操作计算机的。 早期穿孔纸带行列大致能输入字节的指令。 -可以输入K字节的指令那么问题来了哪种语言能够用最少的k表达最多的意思中文吗咱们老祖宗留给我们的瑰宝向言简意赅呀。
这是否意味着可以使用中文作为 的指令提示语言 如果再深入步这个世界上还有比中文更“简洁的语言吗 语言简洁度排名 从中文到英语到西班牙语到日语 有很多研究从不同角度探讨了如何确定世界上各种语言的简洁度。
在这里我们引用两个研究供大家参考。 翻译同文本后的长 希腊 whatspp 数据 短有人对公共互联网上谷歌隐私政策的不同语言翻译进行了评估。 以下是按字符总数排名的语言示例 繁体中文个字符 简体中文个字符 日语 个字符 英语 个字符 西班牙语 个字符 法语 个字符 越南语 个字符 印地语 个字符 这样可以把各个语种的信息密度量化繁体和简体中文确实是非常简洁的语言!但不这么认为。
最有效的语言是什么这同语言的翻译。 语速和简洁度另项研究测量了说话的速度基本假设是“不简洁的语言要更快的说。 研究发现说西班牙语和日语的人语速很快而说汉语和越南语的人语速很慢。
如果以越南语的简洁度为那语言简洁度有以下排名 越南语 中文 英语 西班牙语 日语 当然这项研究并不定准确。因为种语言的语速快慢也和当地人的生活节奏有关。 结合这个排名和上面的表看这也可以从侧面解释为什么西班牙语听起来更快。
基于以上结果是不是说我们只要用中文写大语言模型的指令提示就可以了根本不是。 的词汇主要是英语 尽管英语形态复杂但由于以下几个关键因素英语仍然是大语言模型最青睐的“编程语言 词汇优势像这样的大语言模型主要接受英语文本的训练具备强大的英语词汇和并能理解到语言中用词的细微差别。
提示效率英语通常也是效率最高的提示语言。 文化和语义丰富性英语在许多领域都是种通用语提供了广泛的文化参考和语义深度。 对于大多数大语言模型来说英语是最有效的提示语言原因来自 如何给每种语言编码的。