热门标签 | HotTags
当前位置:  开发笔记 > 人工智能 > 正文

为haar级联生成良好的训练数据

如何解决《为haar级联生成良好的训练数据》经验,为你挑选了1个好方法。

我正在尝试建立haar级联来进行特定字体的OCR; 每个字符一个分类器.

我只需将字体绘制到图像上即可生成大量的训练数据.因此,计划是为每个角色生成积极的训练数据,并使用其他角色的示例作为负面训练数据.

我想知道我应该在训练数据中加入多少变化.通常情况下,我只是尝试一切,但我收集这些东西需要几天训练(对于每个角色!)所以一些建议会很好.

那么,有几个问题:

训练算法是否认识到我不关心透明像素?或者如果我将角色叠加在不同的背景上,它会表现得更好吗?

我应该包含每个角色带有不同前缀和后缀的图像,还是我应该单独处理每个角色?

我应该包括角色放大和缩小的图像吗?我收集的算法几乎忽略了大小,并且无论如何都要降低所有效率?

谢谢!



1> GPPK..:

训练算法是否认识到我不关心透明像素?或者如果我将角色叠加在不同的背景上,它会表现得更好吗?

您在训练数据部分上提供的图像越"噪音",它就会越强大,但是是的,训练所需的时间越长.然而,这是你的负面采样将付诸实施的地方.如果你有尽可能多的负训练样本,尽可能多的范围,那么你将创建更强大的探测器.话虽这么说,如果你有一个特定的用例,那么我会建议略微倾斜你的训练集以匹配它,它会不那么健壮但在你的应用程序中要好得多.

我应该包含每个角色带有不同前缀和后缀的图像,还是我应该单独处理每个角色?

如果要检测单个字母,则单独训练.如果你训练它来检测"ABC"并且你只想要"A"那么它将开始得到混合信息.只需训练每个字母"A","B"等,然后您的探测器应该能够在较大的图像中挑选出每个字母.

我应该包括角色放大和缩小的图像吗?我收集的算法几乎忽略了大小,并且无论如何都要降低所有效率?

我不相信这是正确的.AFAIK HAAR算法无法缩小训练后的图像.因此,如果您使用50x50字母训练所有图像,但图像中的字母为25x25,那么您将无法检测到它们.如果你训练和检测相反的方式,你会得到结果.从小处开始,让算法为您改变大小(向上).


推荐阅读
  • 垂直泊车路径设计
    本文探讨了垂直泊车路径的设计原理与实现方法。垂直泊车是指汽车从特定位置出发,经过一系列横向和纵向移动,最终达到与车位垂直停放的状态。路径设计旨在确保泊车过程既高效又安全。 ... [详细]
  • 本文探讨了在不同场景下如何高效且安全地存储Token,包括使用定时器刷新、数据库存储等方法,并针对个人开发者与第三方服务平台的不同需求提供了具体建议。 ... [详细]
  • This article explores the process of integrating Promises into Ext Ajax calls for a more functional programming approach, along with detailed steps on testing these asynchronous operations. ... [详细]
  • 深入理解MongoDB的SCRAM-SHA-1认证流程
    本文详细解析了MongoDB的SCRAM-SHA-1认证机制的具体步骤,旨在帮助读者深入了解这一安全认证方法的工作原理及其在实际应用中的重要性。 ... [详细]
  • Web开发实践:创建连连看小游戏
    本文详细介绍了如何在Web环境中开发一款连连看小游戏,适合初学者和技术爱好者参考。通过本文,您将了解游戏的基本结构、连线算法以及实现方法。 ... [详细]
  • 本文介绍了如何通过 ADB 命令行工具启动和停止 Android 应用。通过简单的命令,您可以轻松地控制设备上的应用运行状态。 ... [详细]
  • 本文介绍了如何使用jQuery获取浏览器窗口的可视区域高度、文档的整体高度以及宽度等关键尺寸信息,包括边界、填充和边距在内的完整尺寸。 ... [详细]
  • SPFA算法详解与应用
    当图中包含负权边时,传统的最短路径算法如Dijkstra不再适用,而Bellman-Ford算法虽然能解决问题,但其时间复杂度过高。SPFA算法作为一种改进的Bellman-Ford算法,能够在多数情况下提供更高效的解决方案。本文将详细介绍SPFA算法的原理、实现步骤及其应用场景。 ... [详细]
  • 本文详细介绍了Socket在Linux内核中的实现机制,包括基本的Socket结构、协议操作集以及不同协议下的具体实现。通过这些内容,读者可以更好地理解Socket的工作原理。 ... [详细]
  • 探索CNN的可视化技术
    神经网络的可视化在理论学习与实践应用中扮演着至关重要的角色。本文深入探讨了三种有效的CNN(卷积神经网络)可视化方法,旨在帮助读者更好地理解和优化模型。 ... [详细]
  • 我整理了HMOV四大5G旗舰的参数,可依然没能拯救我的选择困难症
    伊瓢茕茕发自凹非寺量子位报道|公众号QbitAI报道了那么多发布会,依然无法选出要换的第一部5G手机。这不,随着华为P40系列发布,目前国 ... [详细]
  • 最优化算法与matlab应用3:最速下降法
    最优化算法与matlab应用3:最速下降法最速下降法是一种沿着N维目标函数的负梯度方向搜索最小值的方法。(1)算法原理函数的负梯度表示如下:搜索步长可调整ak,通常记为(第k次迭代 ... [详细]
  • Java高级工程师学习路径及面试准备指南
    本文基于一位朋友的PDF面试经验整理,涵盖了Java高级工程师所需掌握的核心知识点,包括数据结构与算法、计算机网络、数据库、操作系统等多个方面,并提供了详细的参考资料和学习建议。 ... [详细]
  • 本文探讨了在 Python 2.7 环境下,如何有效地对大量数据(如几百 KB 的字符串)进行加密和压缩,并确保能够准确无误地解密回原始数据。 ... [详细]
  • ACM经典书籍推荐
    本文介绍了几本在算法和计算机科学领域具有重要影响力的书籍,包括由Donald E. Knuth编著的《计算机程序设计艺术》第一卷,以及潘氏兄弟的数论经典教材等。这些书籍不仅是学习相关领域的宝贵资源,也是专业人士不可或缺的参考书。 ... [详细]
author-avatar
手机用户2502921001
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有