TensorFlowLite在移动设备上的部署实践与优化笔记

作者：殇者残雪_270 | 来源：互联网 | 2024-11-05 17:00

近期在探索如何将服务器端的模型迁移到移动设备上，并记录了一些关键问题和解决方案。本文假设读者具备以下基础知识：了解TensorFlow的计算图（Graph）、图定义（GraphDef）和元图定义（MetaGraphDef）。此外，文中还详细介绍了模型转换、性能优化和资源管理等方面的实践经验，为开发者提供有价值的参考。

最近在研究怎么将服务器跑的模型移植到手机端&＃xff0c;需要一些问题记录下~

前提知识&＃xff1a;

1&＃xff09;熟悉 Graph、GraphDef和MetaGraphDef的含义和区别

2&＃xff09;熟悉tf lite官网上的文档&＃xff0c;包括python api和命令行CLI的使用方法&＃xff08;lite converter和lite interpreter&＃xff09;

3&＃xff09;熟悉quantization_aware traning的官网示例&＃xff08;区别于post quantization&＃xff09;

4&＃xff09;熟悉mobilenet_v1官方的train和eval示例

如果熟悉了上面的前提知识&＃xff0c;那么手机端lite移植也就不难了~

步骤&＃xff1a;

1&＃xff09;使用quantization_aware的方式训练模型&＃xff08;quant delay延迟加载&＃xff09;得到checkpoint文件。&＃xff08;包含模型变量的参数值&＃xff09;

2&＃xff09;将train graph转为eval graph。&＃xff08;模型图的前向传播图&＃xff0c;只包含结果&＃xff0c;不包含参数值&＃xff09;

3&＃xff09;基于eval graph&＃xff0c;得到frozen graph&＃xff08;freeze_graph命令行工具&＃xff09;&＃xff0c;将变量转为常量~。&＃xff08;将ckpt文件中变量值附加到前向传播图中&＃xff0c;作为参数常量存在&＃xff0c;也就是“frozen”的意思[将变量冻结为常量]~&＃xff09;

4&＃xff09;调用toco命令行工具&＃xff0c;将frozen graph转为lite graph&＃xff08;指定输入和输出的name、输入的大小、inference的输入和输出类型、GraphDef或其他包含GraphDef的格式文件等等&＃xff09;。

采坑&＃xff1a;

1&＃xff09;量化的graph目标不是train graph&＃xff0c;而是eval graph

2&＃xff09;python api方式转为lite一直报错&＃xff0c;转为freeze_graph&＃43;toco解决

3&＃xff09;freeze_graph和toco命令行的参数说明

4&＃xff09;input_shape要前后始终统一

5&＃xff09;要熟悉Graph、GraphDef、MetaGraphDef等区别

6&＃xff09;熟悉summary.save、savedModel、save_graph_def和export_meta_graph等api的区别

7&＃xff09;熟悉tf的整个流程&＃xff0c;深刻理解tensor和operation的作用和地位

8&＃xff09;post quantization和quantization-aware训练模型&＃xff0c;量化处理的方式不一样&＃xff08;详情见tf官方文档&＃xff09;

如何保证量化之后的精度&＃xff1a;

待定~

更多学习笔记可以关注我的微信公众号「kelly学挖掘」&＃xff0c;欢迎交流。

-- over --

推荐阅读

get
从零构建递归神经网络：仅用NumPy实现

尽管使用TensorFlow和PyTorch等成熟框架可以显著降低实现递归神经网络（RNN）的门槛，但对于初学者来说，理解其底层原理至关重要。本文将引导您使用NumPy从头构建一个用于自然语言处理（NLP）的RNN模型。 ... [详细]

蜡笔小新 2024-12-26 11:29:15
get
深入探讨DB2数据库性能优化策略

本文详细介绍了IBM DB2数据库在大型应用系统中的应用，强调其卓越的可扩展性和多环境支持能力。文章深入分析了DB2在数据利用性、完整性、安全性和恢复性方面的优势，并提供了优化建议以提升其在不同规模应用程序中的表现。 ... [详细]

蜡笔小新 2024-12-28 13:22:19
go
Docker的安全基准

nsitionalENhttp:www.w3.orgTRxhtml1DTDxhtml1-transitional.dtd ... [详细]

蜡笔小新 2024-12-28 13:00:24
get
深入解析Android自定义View面试题

本文探讨了Android Launcher开发中自定义View的重要性，并通过一道经典的面试题，帮助开发者更好地理解自定义View的实现细节。文章不仅涵盖了基础知识，还提供了实际操作建议。 ... [详细]

蜡笔小新 2024-12-28 11:15:04
main
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
main
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
get
深入理解 SQL 视图、存储过程与事务

本文详细介绍了SQL中的视图、存储过程和事务的概念及应用。视图为用户提供了一种灵活的数据查询方式，存储过程则封装了复杂的SQL逻辑，而事务确保了数据库操作的完整性和一致性。 ... [详细]

蜡笔小新 2024-12-27 17:40:42
select
构建基于BERT的中文NL2SQL模型：一个简明的基准

本文探讨了将自然语言转换为SQL语句（NL2SQL）的任务，这是人工智能领域中一项非常实用的研究方向。文章介绍了笔者在公司举办的首届中文NL2SQL挑战赛中的实践，该比赛提供了金融和通用领域的表格数据，并标注了对应的自然语言与SQL语句对，旨在训练准确的NL2SQL模型。 ... [详细]

蜡笔小新 2024-12-27 17:36:19
get
Java面试题解析

本文详细介绍了Java编程语言中的核心概念和常见面试问题，包括集合类、数据结构、线程处理、Java虚拟机（JVM）、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题，帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]

蜡笔小新 2024-12-27 13:55:14
main
MQTT技术周报：硬件连接与协议解析

本周开发笔记重点介绍了在新项目中使用MQTT协议进行硬件连接的技术细节，涵盖其特性、原理及实现步骤。 ... [详细]

蜡笔小新 2024-12-27 11:30:44
install
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13
get
如何在ASP.NET中操作没有runat='server'属性的HTML元素

本文探讨了在不使用服务器控件的情况下，如何通过多种方法获取并修改页面中的HTML元素值。除了常见的AJAX方式，还介绍了其他可行的技术方案。 ... [详细]

蜡笔小新 2024-12-27 06:30:46
const
解读MySQL查询执行计划的详细指南

本文旨在帮助开发者和数据库管理员深入了解如何解读MySQL查询执行计划。通过详细的解析，您将掌握优化查询性能的关键技巧，了解各种访问类型和额外信息的含义。 ... [详细]

蜡笔小新 2024-12-26 20:10:30
main
优化Kafka流状态存储查询的最佳实践

本文探讨了如何优化和正确配置Kafka Streams应用程序以确保准确的状态存储查询。通过调整配置参数和代码逻辑，可以有效解决数据不一致的问题。 ... [详细]

蜡笔小新 2024-12-26 18:17:14
install
Samba服务器配置与CIFS文件共享

本文详细介绍如何使用Samba软件配置CIFS文件共享服务，涵盖安装、配置、权限管理及多用户挂载等关键步骤。通过具体示例和命令行操作，帮助读者快速搭建并优化Samba服务器。 ... [详细]

蜡笔小新 2024-12-26 17:44:08

殇者残雪_270

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章