大模型长度扩展综述:从直接外推ALiBi、插值PI、NTK-aware插值(Meta称之为RoPE ABF)、YaRN到S2-Attention
前言 23下半年,我全力推动我司『七月在线』大模型项目团队的组建,我虽兼管整个项目团队,但为了并行多个项目,最终分成了三个项目组,
扩散模型复习——Diffusion Models Review(Understanding Diffusion Models: A Unified Perspective论文公式推导)
扩散模型复习——Diffusion Models Review(Understanding Diffusion Models: A Unified Perspective论文公式推导) 文章目录扩散模型复习——Diffusion Model
大模型的全面回顾,看透大模型 | A Comprehensive Overview of Large Language Models
大模型的全面回顾:A Comprehensive Overview of Large Language Models返回论文和资料目录 论文地址 1.导读 相比今年4月的中国人民大学发表的大模型综述&#x
大模型“安全护城河”全景解读:从攻防博弈到未来展望
近年来,随着大模型(如 ChatGPT、视觉基础模型、扩散模型等)的迅猛发展,人工智能正以前所未有的速度改变着我们的生活与工作。然而,在享受大模型带来的便捷与创新的同时,其潜藏的安全隐患也逐渐浮出水面。从对抗攻击到越狱提示,再到数据中毒和模
【人工智能】大模型提示词:应对“输出重复”的提示词优化策略
1. 引言:被 “复读机” 困扰的大模型使用场景你是否遇到过这样的情况:让大模型写产品文案,结果反复出现 “科技感十足”“品质卓越”;让它分析代码问题&
多模态提示工程:让AI理解更全面、更深入
多模态提示工程:让AI理解更全面、更深入 引言 背景:从“单模态孤岛”到“多模态交互”的AI革命 2023年3月,OpenAI发布GPT-4,首次公开支持图像输入;同年12月,Google Gemini Pro宣布“原生支持文本、图像
微调数据格式详解:适配任务、模型与生态的最佳实践
一、引言:微调在垂直领域的重要性 通用大模型虽具备强大的基础能力,却在医疗、金融、法律等专业场景中暴露出明显短板:术语混淆(如将“处方药”误作“非处方药”)、风格不符(如法律回答缺失法条引用)、逻辑偏差(如金融分析忽略关键指标)等问题频
51c大模型~合集143
我自己的原文哦~ https:blog.51ctowhaosoft1400163 #海螺新模型海外爆火 一夜之间,猫、羊驼、长颈鹿都学会跳水了 一
微PE官网都该看看的技术:用U盘启动大模型推理环境?
用U盘启动大模型推理环境:微PE式AI沙箱的崛起你有没有想过,像使用微PE工具箱那样,插上一个U盘就能在任何电脑上跑起Qwen-72B的推理?这不是科
浏览器打开Axure RP模型
1,直接使用chrome打开,提示下载插件 2,需要做一些操作 打开原型文件,找到resourceschromeaxure-chrome-exte
**解锁GLM-4.7-Flash的秘密武器,快速生成专业级文本内容**
手把手教你用GLM-4.7-Flash:快速生成高质量文本内容 你是不是也遇到过这些情况?写营销文案卡在第一句,改了八遍还是像AI写的;整理会议纪要时翻着几十页录音转文字,越看越头大;给客户
Hunyuan MT与数据安全:开启AI应用的合规之旅
开源大模型合规应用:Hunyuan MT数据隐私保护指南 1. HY-MT1.5-1.8B 模型概览:轻量高效,专注翻译本质 混元翻译模型 1.5 版本包含两个主力模型:HY-MT1.5-1.8B 和 HY-MT1.5
Qwen2.5-7B-Instruct助力STM32F103C8T6开发者突破技术瓶颈:实例教程
Qwen2.5-7B-Instruct在嵌入式系统中的应用:STM32F103C8T6案例 1. 为什么要在STM32上运行大模型 很多人第一次听到“在STM32上跑大模型”时都会愣一下——这颗只有20KB RAM、6
方言不再是障碍:这款工具以98.2%精准度解决中文音频对齐问题!
Qwen3-ForcedAligner-0.6B惊艳案例:带口音中文访谈音频实现98.2%字级对齐准确率 1. 为什么这个对齐模型让人眼前一亮 你有没有遇到过这样的情况:一段粤语口音浓重的深圳科技公司内部访谈录音,转文
GLM-4.6V Flash WEB开发中遇到Chromedriver地址问题?这份离线解决方案不容错过!
Chromedriver下载地址404错误?GLM-4.6V-Flash-WEB离线方案 在现代AI应用开发中,一个看似不起眼的“404 Not Found”错误,常常能引发整条自动化流水线的崩溃。比如,在CICD流程中执行
GPT2解析:揭秘AI如何撰写出色的文字
一 背景介绍GPT2模型是OpenAI组织在2018年于GPT模型的基础上发布的新预训练模型,其论文原文为GPT2模型的预训练语料库为超过40G的近8000万的网页文本数据,GPT2的预训练语料库相较于GP
超值体验:只需10元就能驾驭7B模型,彻底摆脱硬件限制,畅游数字艺术海洋!
Qwen2.5代码助手实战:10块钱玩转7B模型,无需装机 引言:为什么选择Qwen2.5代码助手? 作为一名培训班老师,你是否遇到过这样的困境:学员的电脑配置参差不齐,有的用轻薄本,有的用游戏本,安装开发环境时总是出
专业揭秘:YOLOv8模型如何利用GPU和CPU资源?
YOLOv8模型监控仪表盘:GPUCPU资源实时追踪 1. 项目概述 今天给大家介绍一个特别实用的工具——YOLOv8模型监控仪表盘。如果你正在使用YOLOv8进行目标检测,这个工具能帮你实时监控GPU和CPU的资源
火焰检测新纪元:YOLOv11实战烟雾与火焰识别指南
本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对火焰与烟雾数据集进行训练和优化,该数据集包含丰富的火焰
火眼金睛:YOLOv11实战解析烟雾与火焰的智能检测
本文采用YOLOv11作为核心算法框架,结合PyQt5构建用户界面,使用Python3进行开发。YOLOv11以其高效的实时检测能力,在多个目标检测任务中展现出卓越性能。本研究针对火焰与烟雾数据集进行训练和优化,该数据集包含丰富的火焰
发表评论