扩展LLMs的上下文窗口

扩展LLMs的上下文窗口

本文介绍了一种称为位置插值（PI）的方法，可以将基于RoPE的预训练LLM的上下文窗口大小扩展到32768个位置，并在各种任务上展示了强大的实证结果。该方法通过线性缩小输入位置索引来实现扩展，同时保持了模型在原始上下文窗口内的质量。通过位置插值扩展的模型保留了原始架构，并可以重复使用大部分预先存在的优化和基础设施。

扩展LLMs的上下文窗口

正文完

发表至：系统工具

2023-07-05

0

ChatGPT 的 AI 替代品

什么是“计算机错误”，该术语从何而来？

如何在 Windows 上关闭人脸识别

Cue：AI 驱动的主动回忆记忆工具

腾讯智影字如何访问智能横转竖

ShortSwitch如何实现自动化

FaceSwap训练流程，Windows版FaceSwap训练AI变脸教程

Mincecraft：基岩版 Beta 获得新更新

Mp3cut在线MP3 音频文件剪辑工具，轻松制作iPhone 铃声

腾讯智影如何使用抹除

如何在WhatsApp上将来自未知号码的电话静音

微软重新推出 PC 健康检查 Windows 11 兼容性工具

概述 ChatGPT 模型

NVIDIA 推出 RTX 40“Super”系列;RTX 4080 Super

腾讯智影如何访问数字人播报功能

如何参与剪映Windows版内测，参加剪映Windows版内测的方法

LeanDojo ：一个开源精益游乐场

Visual Navigation Transformer

文章搜索

热门文章