四川城乡建设厅官方网站宁波网站建设方案咨询

张小明 2026/3/2 16:33:23
四川城乡建设厅官方网站,宁波网站建设方案咨询,seo营销优化,软件开发公司网络安全管理制度tf.keras.losses.SparseCategoricalCrossentropy#xff0c;核心是记住它的「作用」和「使用场景」#xff0c;不用纠结复杂推导#xff5e; 一、先明确#xff1a;这个损失函数是用来干嘛的#xff1f; 它的核心使命是——给模型的“分类答案”打分#xff0c;告诉模型“…tf.keras.losses.SparseCategoricalCrossentropy核心是记住它的「作用」和「使用场景」不用纠结复杂推导一、先明确这个损失函数是用来干嘛的它的核心使命是——给模型的“分类答案”打分告诉模型“猜得对不对、准不准”分数损失值越低说明模型猜得越准。适用场景「单标签多分类任务」每个样本只有一个正确答案比如识别图片是猫/狗/鸟3分类识别数字是0-910分类。二、关键特点“稀疏标签”是什么意思为什么叫“稀疏”“稀疏”是相对于“密集”one-hot编码来说的核心是「标签的写法不同」比如做“猫0、狗1、鸟2”3分类「密集标签one-hot」正确答案是狗标签要写成[0,1,0]像选择题的“答题卡”只有正确选项打勾「稀疏标签」正确答案是狗标签直接写成1像填空题的“答案编号”直接写正确选项的序号。这个损失函数的第一个核心优势不用手动把标签改成one-hot格式直接用整数序号0、1、2…就行省事儿还省内存比如1000分类时稀疏标签只存1个整数one-hot要存1000个0和1。三、核心逻辑它是怎么“打分”的不用公式模型分类时最终会输出「每个类别的“置信度”」比如猜猫的置信度0.1、狗0.8、鸟0.1损失函数的打分规则很简单规则「正确类别的置信度越高损失越低置信度越低损失越高」举3个直观例子3分类正确答案是狗标签1模型输出每个类别的置信度正确类别的置信度损失值打分结果模型表现[0.1, 0.8, 0.1]0.8很高0.22很低猜得准加分[0.3, 0.5, 0.2]0.5中等0.69中等猜得一般[0.9, 0.05, 0.05]0.05很低2.99很高猜反了扣分简单说损失函数就像一个“评委”只盯着「正确答案对应的置信度」——你越确定正确答案得分损失越好越不确定甚至猜反得分越差。四、关键参数2个必须搞懂的设置实际用的时候用得到1.from_logitsTrue/False最关键默认False先搞懂「logits」模型最后一层没经过任何处理的“原始得分”比如[1.0, 3.0, 0.5]不是0-1之间的置信度「置信度」把logits通过「Softmax函数」转换后得到的结果比如上面的[0.1, 0.8, 0.1]总和是1符合“概率”的逻辑。参数选择推荐用from_logitsTrue直接把模型的原始得分logits传给损失函数它内部会自己转换置信度还能避免计算出错比如原始得分太大时直接算置信度会溢出用from_logitsFalse默认必须确保模型输出是0-1之间的置信度比如最后一层加了Softmax否则会报错或计算不准。2.reduction损失的“汇总方式”默认不用改实际训练时一次会喂给模型一批数据比如32个样本这个参数控制“怎么把32个样本的损失汇总成一个数”默认是SUM_OVER_BATCH_SIZE求所有样本损失的「平均值」比如32个样本的损失加起来除以32方便模型调整参数简单理解不用管它默认设置就够用。五、和常见的CategoricalCrossentropy怎么选避免用错两个都是多分类损失函数核心区别就是「标签格式」用表格一眼看明白损失函数标签格式要求适用场景举个例子3分类正确答案是狗SparseCategoricalCrossentropy整数稀疏标签0/1/2…标签是类别序号不想手动转one-hot标签直接写1CategoricalCrossentropyone-hot密集标签[0,1,0]标签已经是one-hot格式标签必须写[0,1,0]总结如果你的标签是“0、1、2”这种整数直接用SparseCategoricalCrossentropy如果是“[0,1,0]”这种向量用CategoricalCrossentropy。六、实际用的时候要注意的2个坑避坑指南标签必须是「0到类别数-1」的整数比如3分类标签只能是0、1、2不能是3或-1否则会报错只适用于「单标签多分类」如果每个样本有多个正确答案比如一张图里既有猫又有狗不能用这个要换BinaryCrossentropy。最后简单代码示例直观感受用最朴素的代码看它怎么工作importtensorflowastf# 1. 定义损失函数推荐from_logitsTrueloss_fntf.keras.losses.SparseCategoricalCrossentropy(from_logitsTrue)# 2. 模拟数据模型预测的原始得分logits、真实标签稀疏标签y_truetf.constant([1,0])# 2个样本的真实标签第1个是1狗第2个是0猫y_pred_logitstf.constant([[1.0,3.0,0.5],[5.0,1.0,0.1]])# 模型输出的原始得分# 3. 计算损失lossloss_fn(y_true,y_pred_logits)print(批量损失值,loss.numpy())# 输出约0.15两个样本损失的平均值数值越小越好运行结果说明模型对这两个样本的预测整体不错损失值很低核心总结记3句话就行用途给「单标签多分类」模型打分判断预测准不准特点直接用整数标签0/1/2…不用转one-hot省事儿逻辑正确类别的置信度越高损失越低模型越棒。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

珠海柏泰教育官方网站建设网站设计的基本原则

深入理解 SharePoint 工作流:功能、部署与表单应用 1. 工作流完成状态与验证 当 SharePoint 工作流完成时,“共享文档”列表会新增名为 “My First Workflow” 的列,用于显示工作流的当前状态。若一切按预期完成,该列值为 “Completed”;若工作流仍在运行,显示 “In Pr…

张小明 2026/1/12 15:52:16 网站建设

免费做自己的网站有钱赚吗自学网站建设推荐

快速体验 打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容: 开发一个企业级代码质量检查工具,专门针对Python项目中的deprecation warning。工具应能扫描整个项目目录,生成详细的警告报告,包括:…

张小明 2026/1/12 15:50:13 网站建设

网站建设内容策划wordpress的md

【摘要】融合传统量化因子计算与大模型逻辑推理,构建T-1日盘前A股智能决策系统,实现数据驱动的持仓诊断与交易指引。 引言 在金融科技领域,个人投资者面临着两座难以逾越的大山:一是量化交易系统的开发门槛,二是海量市…

张小明 2026/1/12 15:48:10 网站建设

e2ee网站开发那个网站做足球测

计算机毕设java婴幼儿奶粉推荐系统61a259(配套有源码 程序 mysql数据库 论文) 本套源码可以在文本联xi,先看具体系统功能演示视频领取,可分享源码参考。随着社会的发展和生活水平的提高,婴幼儿的营养健康越来越受到家长的重视。选…

张小明 2026/1/12 15:44:03 网站建设

快速仿站网站建设婚纱网站建设 最开始

文章目录具体实现截图主要技术与实现手段关于我本系统开发思路java类核心代码部分展示结论源码lw获取/同行可拿货,招校园代理 :文章底部获取博主联系方式!具体实现截图 同行可拿货,招校园代理 python基于AES的文件夹加密解密系统的设计与实现_n11215r…

张小明 2026/1/12 15:42:02 网站建设

asp网站生成静态网站改不了分类

第一章:为什么90%的云原生Agent在Docker故障时失效?真相令人震惊:许多云原生Agent在设计时过度依赖Docker守护进程的稳定性,一旦Docker服务崩溃或重启,这些Agent便立即失去对容器生命周期的感知能力,导致监…

张小明 2026/1/12 15:40:00 网站建设