MiniMax 年度会员 API 实测:图像生成 + 语音合成,到底好不好用?
MiniMax 年度会员 API 实测:图像生成 + 语音合成,到底好不好用?作者:研路炼钢日期:2026年3月26日 前言 前阵子入手了 MiniMax 年度会员 Plus 版,一直听说有语音合成(TTS)HD 功能,但打开后台一看—— 一脸懵逼。 额度写着 4000 字符/天,模型写的是 “Speech 2.8”,但 API 怎么调?文档在哪?选哪个模型?一头雾水。 干脆花了一整天自己调研,把图像生成和语音合成两大功能都测了一遍,能踩的坑都踩了,写成这篇文章,给同样迷茫的你。 一、测试环境 API 平台:https://platform.minimaxi.com API 地址:https://api.minimaxi.com 认证方式:Bearer Token 先用 curl 扫了一遍 MiniMax API,发现以下端点存在: 1234567/v1/t2a_v2 - TTS 语音合成 ✅/v1/t2a_async - 异步 TTS/v1/image_generation - 图像生成 ✅/v1/video_generation ...
2026年3月26日
2026年3月26日 星期四昨日计划完成情况 深度学习25分钟+1节课程(9:00-9:30 固定时段)→ ❌ 未完成 论文阅读30分钟(9:30-10:00 固定时段)→ ❌ 未在计划时段完成 继续跑实验并记录结果 → ✅ 服务器训练模型 按新饮食计划执行 → ✅ 第一天执行良好 完成率:2/4 今日记录上午(8:00-12:00) 8:00 从宿舍出发,8:30 到实验室,买玉米+两个鸡蛋当早餐 8:30-9:00 跑补充实验 9:00-9:30 实验电脑一直卡机,去闲鱼找 AutoGL 代充75折,用子账号 9:30-10:30 租了1天服务器,配置 AI 环境(codex、qwen、kimi),用腾讯云 COS 上传下载,速度很快 10:30-11:00 开始跑模型,换设备改配置文件和 batch 大小 11:00-11:40 散步去吃午饭,半碗米饭+小炒肉+胡萝卜牛肉+青菜 下午(12:00-18:00) 11:40-13:00 训练模型多agent,服务器上探索 Minimax 文生图、文生音频功能 13:00-14:00 取电瓶车、取快递,继续分析论...
2026年3月25日
2026年3月25日 星期二昨日计划完成情况 完善刘老师要求的PPT → ✅ 已完成并交给石老师 跑实验 → ✅ 从到实验室开始持续跑6h+ 论文阅读 → ✅ 晚上读了1小时 完成率:2.5/3 今日记录上午(9:30-12:00) 9:30 从宿舍出发,吃牛肉面 10:00 到达实验室 10:30-12:00 完善刘老师要求的PPT 下午(12:00-18:00) 12:00-13:00 听辅导员开就业会议 13:00-14:00 整理好PPT,交给石老师 14:00-14:30 帮雅元和程果配置Claude Code 14:30-15:00 分享OpenRouter付费体验及不同Agent 15:00-16:00 帮思宇点赞、记录时间日志、下载Steam和Wallpaper Engine 16:00-17:00 帮姐夫搞龙虾、龙哥搞算法、自己继续配置Wallpaper Engine、补前两天日记、拿快递 17:00-17:30 吃晚饭(牛肉炒胡萝卜+青菜+番茄炒蛋) 17:30-18:30 配置桌面壁纸、购买补给(维生素B族、D+早餐奶、全麦面包、坚果)、继续跑...
2026 年 3 月 24 日
2026 年 3 月 24 日 星期二今日记录上午 休息 下午 午饭和亲戚一起 父亲和五姨父去看望摔倒的外婆 和弟弟聊了很多《蛊真人》,很喜欢这本书 傍晚 回去洗澡 飞了 100 张无人机的照片 回家吃晚饭 晚上 19:30 高铁出发 22:30 到达上海 纪元来接 状态 精力:7/10(休息恢复,准备返程) 情绪:7/10(和弟弟聊天很开心) 专注:⭐⭐⭐☆☆(休息日为主) 今日收获 《蛊真人》:和弟弟聊这本书,很喜欢 无人机:飞了 100 张照片 外婆:父亲和五姨父去看望,摔得不算严重 今日卡点 论文阅读连续 5 天未执行 健身连续多天中断 外婆摔倒 感悟 和弟弟聊《蛊真人》,这本书听起来很有意思,找时间读一读。 两天在家休息,恢复了不少精力。明天回上海要重新聚焦核心任务。 外婆摔倒是意外,所幸不算严重。要多关心家人。 明日计划 论文阅读(打开 PDF 1 分钟)必须恢复 违建数据集(看模型结果) 违建数据集(跑模型) 健身(健身房或散步)恢复 早睡(22:00 提醒,23:00 放下手机)重新开始 自动链接: [[02-The...
2026 年 3 月 23 日
2026 年 3 月 23 日 星期一今日记录上午 表妹结婚,午饭亲戚一起聚餐 下午 吃完午饭后随机坐了一辆公交,做了一个多小时,放宽了一下内心 找了一个公园,飞了一会无人机 不小心被公园的板凳绊倒,休息了一会 晚上 去吃晚饭(婚礼) 婚礼时间很短,很快结束了,有点从简 总体感觉都还不错 研究笔记本(太卡了),早早关机睡觉 状态 精力:7/10(休息为主,恢复不错) 情绪:8/10(表妹结婚很开心) 专注:⭐⭐⭐☆☆(休息日,未专注核心任务) 健康打卡 睡眠:未记录(早睡) 喝水:未记录 运动:❌ 未执行 早餐:亲戚聚餐 午餐:亲戚聚餐 晚餐:婚宴 习惯追踪 论文阅读 ❌ 未执行 散步/运动 ❌ 未执行 23:30 前睡觉 ✅ 早睡 今日收获 表妹婚礼:见证表妹结婚,亲戚团聚很开心 无人机:在公园飞了无人机,放宽内心 意外跌倒:被板凳绊倒,休息后无大碍 今日卡点 外婆摔倒了(晚上得知消息) 笔记本太卡 核心任务全部未执行(回家日) 自我反思模式识别:今天是典型的”回家/休息日”,没有强制性的核心任务。主要时间花在亲戚聚餐和自我放松上。跌倒是个小插曲,所...
2026 年 3 月 22 日
2026 年 3 月 22 日 星期日昨日计划完成情况 论文阅读(打开 PDF 1 分钟)→ ❌ 连续 3 天未执行 违建数据集(看模型结果)→ ❌ 未执行(回家) 违建数据集(跑模型)→ ❌ 未执行 早睡(22:00 提醒,23:00 放下手机)→ ❌ 凌晨 1 点才睡 完成率:0/4 今日记录上午(黄金时段 9:00-12:00) 9:00 起床,洗衣服、收拾宿舍、整理东西,晾衣服 10:30 离开宿舍,11:00 去南亚小馆吃牛肉面(加一个鸡蛋) 11:00-13:00:在实验室,用 MiniMax API 做 Agent(文件处理、纹身图、纹身音频),看论文 下午 13:00 纪元送到高铁站,14:30 出发 14:30-17:30:高铁上思考: 做庄家比较有意思(证券市场逻辑) 大模型时代,token 就是庄家,不同厂商的 token 是不同的庄家 晚上 17:30 到达目的地 18:30-21:30:亲戚聚餐(三姨、六姨娘、五姨娘家),妹妹明天结婚,和哥哥小酌半杯酒 21:30-22:00:和哥哥交流减肥方法(他从 190 斤减到 160 斤)...
2026 年 3 月 21 日
2026 年 3 月 21 日 星期六昨日计划完成情况 论文阅读(打开论文 PDF 1 分钟)→ ❌ 连续 2 天未执行 违建数据集(看模型结果)→ ✅ 跑模型 + 训练方法优化 健身(散步 30 分钟或健身房)→ ✅ 健身房 2h 早睡(22:00 提醒,23:00 放下手机)→ ❌ 待执行 完成率:2/5(数据集 + 健身完成) 今日记录上午(黄金时段 9:00-12:00) 10:00 起床,在宿舍折腾到 11 点 11:00-11:30:去吃牛肉面,去实验室 11:30-12:00:拉肚子,刷手机 下午 12:00-13:00:整理电脑,找数据集,看标注情况,看 OpenClaw 13:00-14:00:研究 Kilo CLI,研究模型调优出现的问题 14:00-15:00:休息,整合大脑的思维 15:00-16:00:整理整个电脑文件(Claude + Qwen + Claude Code) 16:00-18:00:和纪元女朋友安装 CLI(帮别人做事) 晚上 18:00-18:30:整理电脑 18:30-19:00:和考研学妹讲导师选择 19:00...
DeepSeek 给我编了一篇根本不存在的论文
前阵子写论文找参考文献,我让 DeepSeek 帮忙推荐几篇 Transformer 在目标检测领域的综述。 它给了我五篇,格式完美——作者、期刊、年份、DOI 一应俱全。我还觉得挺靠谱,顺手就往论文里引了两篇。 后来导师让我把参考文献的原文都下载一遍核对。我拿 DOI 去搜,第一篇——链接无效。第二篇——Google Scholar 查无此文。作者名字搜了一圈,根本不存在这个人。 五篇里有三篇是 AI 编的。格式像真的,内容是假的。 当时我后背发凉。如果没核实就交了,轻则被导师骂,重则学术不端。 后来我在小红书上看到一个研究生发帖吐槽:”怎样防止 DeepSeek 编造文献啊,我都快病了。”底下一堆人附和。说明这不是个例。 AI 为什么会编文献? 先说清楚一件事:AI 不是在骗你,它只是在”预测”。 当你说”给我找五篇关于 XXX 的文献”,AI 的逻辑是:你要”文献”,文献应该有作者、标题、期刊、年份、DOI——那我就生成一个”看起来像文献”的东西。 它不知道这个文献是否真实存在。它没有”真假”的概念,只有”像不像”的概念。 训练数据里有大量的论文引用格式,所以它能生成格...
70 场面试换来的一句话:实习比学历重要
最近看到一个研究生的秋招复盘,数据很扎实:70 场面试,3 段实习,2 个大厂 offer。 他总结出来的核心发现让我印象很深:厂招的优先级排序是”实习 > 学历 > 项目 > 论文”。 匹配的实习加上学历过关,基本都有进面机会。而很多人(包括我自己)以为论文最重要——但现实是,大部分人的论文方向跟 LLM 不搭,所以论文在这个赛道的权重反而最低。 作为一个还在读研、也在考虑未来方向的人,这个排序对我触动很大。今天把他的经验整理一下,加上我自己的理解,分享给同样在准备秋招或者还在犹豫方向的同学。 第一份实习:别挑,先上桌 他的建议是:第一份实习去大公司做日常实习。 为什么?大公司的招聘流程规范,不会因为你没有实习经历就刷人,而且有培养体系,能真正学到东西。更关键的是:有了第一份大公司实习背景,第二份、第三份实习就好找多了。 准备周期也不长。简历上有一个 LLM 相关项目(哪怕是竞赛复现的),刷完 LeetCode hot100 前 50 题,transformer 基础八股过一遍,就可以开始投了。 投递渠道就那几个:Boss 直聘搜”LLM实习””大模型实习...
OpenClaw 的主智能体和子智能体,为什么加载的东西不一样?
我在配置 OpenClaw 多 Agent 工作流的时候,发现一个有意思的设计:主智能体启动时加载 7 个文件,子智能体只加载 2 个。 一开始我觉得奇怪——子智能体为什么不把人格、记忆、用户信息都加载上?不是越完整越好吗? 后来想明白了:子智能体不需要”人格”,它只需要干活。 这个设计背后有一套很清晰的哲学,今天把我理解到的分享出来。 主智能体加载了什么? 主智能体启动时,按顺序加载 7 层文件: 第一层是 AGENTS.md,智能体的基础配置——全局指令、工作目录,红线规则。这是所有智能体的地基,所以第一个加载。 第二层是 TOOLS.md,工具配置——有哪些工具可用、怎么调用。没有工具,智能体什么都干不了。 第三层是 SOUL.md,人格注入——这个智能体是什么性格、什么语气、怎么对待用户。这是主智能体和子智能体最大的区别所在。 第四层是 IDENTITY.md,身份信息——名字、头像、特征,让主智能体知道”我是谁”。 第五层是 USER.md,用户信息——用户的偏好、背景、上下文,让主智能体理解”我在跟谁说话”。 第六层是 HEARTBEAT.md,心跳机制——定期检...







