
推荐文章
- [论文翻译]Flash-VStream: 基于内存的长视频流实时理解系统
- [论文翻译]LinVT: 赋能图像级大语言模型理解视频
- [论文翻译]通用医疗人工智能的基础模型
- [论文翻译]Draft-and-Revise: 基于上下文RQ-Transformer的高效图像生成
- [论文翻译]HuggingGPT: 用ChatGPT和Hugging Face上的模型解决AI任务
- [论文翻译]一种用于抽取式文档摘要的分层结构化自注意力模型 (HSSAS)
- [论文翻译]检索即注意力:在单一Transformer中端到端学习检索与阅读
- [论文翻译]PROMPTCAP: 基于提示引导的任务感知图像描述生成
- [论文翻译]ByT5: 迈向基于字节到字节预训练模型的无Token未来
- [论文翻译]Chain-of-Action: 基于大语言模型的可靠多模态问答