热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Tensorboardcausesotherapps&daemonstocrash.

12345678910111213141516171819202122232425262728293031323334353637383940414243TensorBoard 1.14 -- on

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
TensorBoard 1.14 -- on Ubuntu 18.04 LTS. A production training server, so apps

cannot be upgraded here.

It makes BOINC client (daemon) unresponsive and dead.

root-107:~# boinccmd --read_global_prefs_override

Operation failed: read() failed

...and after restaring Tensorboard -- boinc suddenly works again ! (for a few minutes... and fails again)

Problem is very much reproducible on my server.

---





steps to reproduce (BOINC side):

# apt-get install boinc-client

cd /var/lib/boinc-client/

boinccmd --project_attach http://www.worldcommunitygrid.org/  $KEY

boinccmd --set_network_mode always

boinccmd --set_run_mode always

boinccmd --set_gpu_mode never

root-107:~# boinccmd --read_global_prefs_override

root-107:~#



...

this is on a server that was running BOINC for an entire *month* with zero issues,

before tensorflow and tensorboard were installed.

...

this server has enough RAM memory and disk space, so those issues can be ruled out:

root-107:~# uptime

 00:31:18 up 44 days,  2:37, 16 users,  load average: 57.85, 59.09, 57.01

root-107:~# free -h

              total        used        free      shared  buff/cache   available

Mem:           125G         36G        882M        1.0G         88G         87G

Swap:          8.0G        100M        7.9G

root-107:~# df -h

Filesystem      Size  Used Avail Use% Mounted on

udev             63G     0   63G   0% /dev

tmpfs            13G  2.8M   13G   1% /run

/dev/sda2       916G  358G  512G  42% /

tmpfs            63G  100K   63G   1% /dev/shm

tmpfs           5.0M     0  5.0M   0% /run/lock

tmpfs            63G     0   63G   0% /sys/fs/cgroup

/dev/loop2       90M   90M     0 100% /snap/core/8039

tmpfs            13G     0   13G   0% /run/user/1000

/dev/loop0       90M   90M     0 100% /snap/core/8213

tmpfs            13G     0   13G   0% /run/user/0

该提问来源于开源项目:tensorflow/tensorboard

: Thanks for investigating and checking back in! The memory issues
are a known issue generally (#766), unless you’re seeing differentially
high memory usage with BOINC in play. The X session sounds like a bug in
BOINC: it’s true X servers frequently use 60xx ports, but BOINC
shouldn’t be assuming that behavior just because one of those ports
happens to be open.



Perhaps as a workaround for the port issue you could ask TensorBoard to
run on a different port, by passing

1
--port 9009

or similar?



I’m going to close this as it doesn’t look like there’s anything
actionable on our side. Thanks again for the report, and feel free to
follow up if there’s more that we can do for you.


   



推荐阅读
  • 本文详细介绍了如何安全地手动卸载Exchange Server 2003,以确保系统的稳定性和数据的完整性。根据微软官方支持文档(https://support.microsoft.com/kb833396/zh-cn),在进行卸载操作前,需要特别注意备份重要数据,并遵循一系列严格的步骤,以避免对现有网络环境造成不利影响。此外,文章还提供了详细的故障排除指南,帮助管理员在遇到问题时能够迅速解决,确保整个卸载过程顺利进行。 ... [详细]
  • 浅析python实现布隆过滤器及Redis中的缓存穿透原理_python
    本文带你了解了位图的实现,布隆过滤器的原理及Python中的使用,以及布隆过滤器如何应对Redis中的缓存穿透,相信你对布隆过滤 ... [详细]
  • 网站访问全流程解析
    本文详细介绍了从用户在浏览器中输入一个域名(如www.yy.com)到页面完全展示的整个过程,包括DNS解析、TCP连接、请求响应等多个步骤。 ... [详细]
  • MySQL的查询执行流程涉及多个关键组件,包括连接器、查询缓存、分析器和优化器。在服务层,连接器负责建立与客户端的连接,查询缓存用于存储和检索常用查询结果,以提高性能。分析器则解析SQL语句,生成语法树,而优化器负责选择最优的查询执行计划。这一流程确保了MySQL能够高效地处理各种复杂的查询请求。 ... [详细]
  • 本章节在上一章的基础上,深入探讨了如何通过引入机器人实现自动聊天、表情包回应以及Adidas官方账号的自动抽签功能。具体介绍了使用wxpy库进行微信机器人的开发,优化了智能回复系统的性能和用户体验。通过详细的代码示例和实践操作,展示了如何实现这些高级功能,进一步提升了机器人的智能化水平。 ... [详细]
  • 在Windows环境下离线安装PyTorch GPU版时,首先需确认系统配置,例如本文作者使用的是Win8、CUDA 8.0和Python 3.6.5。用户应根据自身Python和CUDA版本,在PyTorch官网查找并下载相应的.whl文件。此外,建议检查系统环境变量设置,确保CUDA路径正确配置,以避免安装过程中可能出现的兼容性问题。 ... [详细]
  • [转]doc,ppt,xls文件格式转PDF格式http:blog.csdn.netlee353086articledetails7920355确实好用。需要注意的是#import ... [详细]
  • window下的python安装插件,Go语言社区,Golang程序员人脉社 ... [详细]
  • 如何在Java中使用DButils类
    这期内容当中小编将会给大家带来有关如何在Java中使用DButils类,文章内容丰富且以专业的角度为大家分析和叙述,阅读完这篇文章希望大家可以有所收获。D ... [详细]
  • 本文详细介绍了 InfluxDB、collectd 和 Grafana 的安装与配置流程。首先,按照启动顺序依次安装并配置 InfluxDB、collectd 和 Grafana。InfluxDB 作为时序数据库,用于存储时间序列数据;collectd 负责数据的采集与传输;Grafana 则用于数据的可视化展示。文中提供了 collectd 的官方文档链接,便于用户参考和进一步了解其配置选项。通过本指南,读者可以轻松搭建一个高效的数据监控系统。 ... [详细]
  • 服务器部署中的安全策略实践与优化
    服务器部署中的安全策略实践与优化 ... [详细]
  • 本文介绍了如何利用 Delphi 中的 IdTCPServer 和 IdTCPClient 控件实现高效的文件传输。这些控件在默认情况下采用阻塞模式,并且服务器端已经集成了多线程处理,能够支持任意大小的文件传输,无需担心数据包大小的限制。与传统的 ClientSocket 相比,Indy 控件提供了更为简洁和可靠的解决方案,特别适用于开发高性能的网络文件传输应用程序。 ... [详细]
  • Windows环境下RabbitMQ安装详尽指南
    Windows环境下RabbitMQ安装详尽指南 ... [详细]
  • 在稀疏直接法视觉里程计中,通过优化特征点并采用基于光度误差最小化的灰度图像线性插值技术,提高了定位精度。该方法通过对空间点的非齐次和齐次表示进行处理,利用RGB-D传感器获取的3D坐标信息,在两帧图像之间实现精确匹配,有效减少了光度误差,提升了系统的鲁棒性和稳定性。 ... [详细]
  • 本文深入探讨了数据库性能优化与管理策略,通过实例分析和理论研究,详细阐述了如何有效提升数据库系统的响应速度和处理能力。文章首先介绍了数据库性能优化的基本原则和常用技术,包括索引优化、查询优化和存储管理等。接着,结合实际应用场景,讨论了如何利用容器化技术(如Docker)来部署和管理数据库,以提高系统的可扩展性和稳定性。最后,文章还提供了具体的配置示例和最佳实践,帮助读者在实际工作中更好地应用这些策略。 ... [详细]
author-avatar
愛情伈語gg
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有