热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

tensorflow数据归一化_实习|DellEMC数据保护部门实习生面试,三面面经

作者:二零二零链接:https:www.nowcoder.comdiscuss207579来源:牛客网这个实习是7月初投递的,

作者:二零二零
链接:https://www.nowcoder.com/discuss/207579
来源:牛客网

这个实习是7月初投递的,7月15日下午4点左右电话一面,当天面试完没过多久就预约了第二天[7月16日]下午二面。

一面电话面

面试官所问的问题范围都比较大,主要让介绍了项目,还有基本上我简历上涉及到的算法都让我回答了一遍自己的认识。

一面和二面的面试官没有来得及沟通,所以还是重新对我进行了一个基本的技术上的了解。

二面技术面

还是针对简历上的来挖的知识点,比一面要更详细一点,主要的问题包括:

Q:简单介绍一下简历上的项目【回答:项目最终目的,feature,target,项目中涉及到的技术点】

项目中涉及到的编码【我结合项目特征介绍的One-hot编码】

因为项目中涉及到了RandomForest和GBDT,相当于RF的效果最好,有没有考虑过为什么RF的效果会比GBDT的效果好?【没回答上来】

项目是独立完成还是小组,你的主要工作在哪一部分?【小组形式,前期数据的一个处理,数据挖掘

你的项目中还有写到一个网上的在线课程学习,这个课程中你有加入到自己的想法或者处理什么的?【课程就是让接触到项目,项目的结果会从网上搜索进行结果的对比,相当于结果还是参照了部分网络上的结果】

使用python进行机器学习有多长时间?

关于实习经历的询问

Q:简单介绍一下实习经历的工作过程,自己的工作以及对于这个问题的了解。

Q:挑选一种机器学习算法讲讲自己的理解【LR 基本的思想 目标假设、损失函数、优化过程 输入数据的归一化 用 用正则化项防止过拟合】

LR用在你的平常中的项目中优点在哪,缺点在哪?【容易出现过拟合,容易受到异常点的影响】

用LR+GBDT组合式的训练有做过吗?【没有】

Q:本科的绩点

Q:Bagging和Boosting的最大的区别【样本使用】

Bagging和Boosting的各自的优劣以及对应方法的举例【Bagging:RF Boosting:Adaboost、xgboost、GBDT】

Q:研究生的主修课程

Q:自我介绍

因为表达了自己想积累一些机器学习领域的经验,所以面试官就对公司以及涉及到的机器学习领域的项目进行了介绍,表达了项目中可能不仅仅涉及到机器学习,希望我能做好衡量。

Q:机器学习的库有用过哪些?【sklearn、tensorflow】

Q:在数据清洗中遇到的数据噪音[异常数据]【缺省值】

对于缺省值的处理【结合项目说明了少量缺失值的处理】

版本问题造成的不同程度上的缺省值有遇到吗?比如旧版本到新版本的数据会有一部分feature缺省,但是这种数据我们还是需要的,在投入模型之前应该怎么处理?【这个不太清楚】

在投入模型之前,做特征选择和特征除噪的方法,你有了解过吗?【接触过模型所做的特征选择,未知模型选择之前,没有接触过太多 统计类的方法接触过一点】

数据可视化分析,主要用过什么样的可视化方法?【柱状图 热力图 散点图】

有没有多维度数据的可视化分析?【没有接触过】

Q:英语六级的成绩

三面

领导面

Q:暑期现在在做什么【学习tensorflow】

Q:以你现在的理解讲解一下tensorflow,为什么需要tensorflow,它主要解决的什么问题?

Q:实习经历中提到了数据清洗,讲解一下清洗的工作是怎么做的?

Q:写程序写的多吗?用什么语言?

Q:学过操作系统吗,C++用的多吗?

Q:有哪些意向企业?

Q:选择这个方向的原因,兴趣还是因为热门?

Q:描述一下随机森林

Q:随机森林主要用于解决什么类的问题?

Q:你知道Dell EMC吗?有多少了解

Q:对外企有什么了解?自己想去什么样子的?

然后领导就和我介绍了一部分部门的工作内容以及将来的一个目标设想,让我考虑好可能在将来机器学习同时会涉及到一部分研发,而且表示招实习生希望能比较稳定,培养完表现好希望能留下来,让我能做好自己的考虑。中途领导总给我说让我考虑这个实习是不是兴趣所在,然后就不说话了,尬了,不知道是不是希望我表达一个很正面的、积极的意愿?

然后就完了,这是不是已经凉了 怎么感觉实习也这么难

与作者交流:https://www.nowcoder.com/discuss/207579

更多笔经面经:https://www.nowcoder.com/discuss?order=0&type=2



推荐阅读
  • 本文节选自《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书的第1章第1.2节,作者Nitin Hardeniya。本文将带领读者快速了解Python的基础知识,为后续的机器学习应用打下坚实的基础。 ... [详细]
  • Python与R语言在功能和应用场景上各有优势。尽管R语言在统计分析和数据可视化方面具有更强的专业性,但Python作为一种通用编程语言,适用于更广泛的领域,包括Web开发、自动化脚本和机器学习等。对于初学者而言,Python的学习曲线更为平缓,上手更加容易。此外,Python拥有庞大的社区支持和丰富的第三方库,使其在实际应用中更具灵活性和扩展性。 ... [详细]
  • 基于TensorFlow的鸢尾花数据集神经网络模型深度解析
    基于TensorFlow的鸢尾花数据集神经网络模型深度解析 ... [详细]
  • 自然语言处理(NLP)——LDA模型:对电商购物评论进行情感分析
    目录一、2020数学建模美赛C题简介需求评价内容提供数据二、解题思路三、LDA简介四、代码实现1.数据预处理1.1剔除无用信息1.1.1剔除掉不需要的列1.1.2找出无效评论并剔除 ... [详细]
  • 机器学习算法:SVM(支持向量机)
    SVM算法(SupportVectorMachine,支持向量机)的核心思想有2点:1、如果数据线性可分,那么基于最大间隔的方式来确定超平面,以确保全局最优, ... [详细]
  • 本文介绍如何使用OpenCV和线性支持向量机(SVM)模型来开发一个简单的人脸识别系统,特别关注在只有一个用户数据集时的处理方法。 ... [详细]
  • Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]
  • 在机器学习领域,深入探讨了概率论与数理统计的基础知识,特别是这些理论在数据挖掘中的应用。文章重点分析了偏差(Bias)与方差(Variance)之间的平衡问题,强调了方差反映了不同训练模型之间的差异,例如在K折交叉验证中,不同模型之间的性能差异显著。此外,还讨论了如何通过优化模型选择和参数调整来有效控制这一平衡,以提高模型的泛化能力。 ... [详细]
  • 探索聚类分析中的K-Means与DBSCAN算法及其应用
    聚类分析是一种用于解决样本或特征分类问题的统计分析方法,也是数据挖掘领域的重要算法之一。本文主要探讨了K-Means和DBSCAN两种聚类算法的原理及其应用场景。K-Means算法通过迭代优化簇中心来实现数据点的划分,适用于球形分布的数据集;而DBSCAN算法则基于密度进行聚类,能够有效识别任意形状的簇,并且对噪声数据具有较好的鲁棒性。通过对这两种算法的对比分析,本文旨在为实际应用中选择合适的聚类方法提供参考。 ... [详细]
  • 本文提供了PyTorch框架中常用的预训练模型的下载链接及详细使用指南,涵盖ResNet、Inception、DenseNet、AlexNet、VGGNet等六大分类模型。每种模型的预训练参数均经过精心调优,适用于多种计算机视觉任务。文章不仅介绍了模型的下载方式,还详细说明了如何在实际项目中高效地加载和使用这些模型,为开发者提供全面的技术支持。 ... [详细]
  • 谷歌工程师:TensorFlow已重获新生;网友:我还是用PyTorch
    乾明发自凹非寺量子位报道|公众号QbitAI道友留步!TensorFlow已重获新生。在“PyTorch真香”的潮流中,有人站出来为TensorFlow说话了。这次来自谷歌的工程师 ... [详细]
  • Matplotlib在数据科学中的可视化应用与技术解析
    Matplotlib和数据可视化 数据的处理、分析和可视化已经成为Python近年来最为重要的应用领域之一,其中数据的可视化指的是将数据呈现为漂亮的统计图表ÿ ... [详细]
  • TensorFlow基础知识深化讲解
    批标准化批标准化(batchnormalization,BN)是为了克服神经网络层数加深导致难以训练而诞生的。深度神经网络随着深度加深,收 ... [详细]
  • python模块之正则
    re模块可以读懂你写的正则表达式根据你写的表达式去执行任务用re去操作正则正则表达式使用一些规则来检测一些字符串是否符合个人要求,从一段字符串中找到符合要求的内容。在 ... [详细]
  • 非计算机专业的朋友如何拿下多个Offer
    大家好,我是归辰。秋招结束后,我已顺利入职,并应公子龙的邀请,分享一些秋招面试的心得体会,希望能帮助到学弟学妹们,让他们在未来的面试中更加顺利。 ... [详细]
author-avatar
拍友2502878393
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有