热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

NLP算法求建议|腾讯VS美团

作者|曾同学编辑|NewBeeNLP面试锦囊之面经分享系列,持续更新中后台回复『面试』加入讨论组交流噢lz从3月初脚因打球扭伤了开始,投递简历ÿ

作者 | 曾同学

编辑 | NewBeeNLP

面试锦囊之面经分享系列,持续更新中 

后台回复面试』加入讨论组交流噢 

lz从3月初脚因打球扭伤了开始,投递简历,接二连三的面试鞭尸又面试,昨天才终于上岸了,分享经验~

腾讯PCG看点(已OC)

一面

  • 自我介绍

  • 项目介绍

  • 项目改进优化的点,怎么导入图谱知识加强实体表征

  • 反问

一面面试官人特好,而且很随和,没有八股文没有code,总体面试体验很棒,大概面了45分钟

二面

  • 自我介绍

  • 项目介绍(很详细,从预训练语料到loss,然后到应用场景,模型上线细节,评测,全讲了一遍)

  • loss设计 triplet loss和交叉熵loss各自的优缺点,怎么选择

  • 介绍一下attention机制

  • 介绍一下ernie模型

  • 还有什么其他比较基础的Nlp技术,我回答中包括了ner,于是问我目前比较流行的ner模型,我回答了bert\flat

  • 简单介绍一下flat及对于嵌套式语料的融合方式

  • code topK两种方式 (暴力,快排)

二面是二对一,面试时长达到了惊人的两小时,而且那天刚好杭州突然天气转凉,刮风下雨,坐在实验室外面冷得发抖,喉咙也干的不行。。二面压力应该是最大的把,问得很细致

三面

  • 自我介绍

  • 项目介绍

  • 调参技巧,评估指标

  • 模型不收敛原因分析,解决方案(学习率,权重初始化,数据标注,样本不平衡问题等等

  • 梯度消失和梯度爆炸原因分析及解决办法(激活函数,网络层次,正则化

  • 介绍transformer(从encode端到decode端完整的说了一遍

  • 提升指标的一些trick 调参之前说过了,就说了加对抗训练,及实现细节

  • 模型蒸馏work的原因,具体实现方式

三面对细节要求较高,基本都是一些比较基础的深度学习的知识

四面(主管面)

这里我不得不先吐槽一下,我一度以为凉了,结果3.31才给我更新了状态说是主管面。。。隔了将近半个月

  • 自我介绍

  • 项目介绍

  • 项目优化的点,模型迭代多少个版本解决了什么问题

  • 你觉得对你模型提升最大的点在哪里

  • 局限性

  • 如果过来实习的实习时间和时长

四面是个女主管,语气很好比较温柔,就是太能拖了,拖了半个月。。然后这里还有一个小插曲,4.1号那天开了个愚人节玩笑,我流程显示已经终止了。。所以Lz又马上投了美团,pdd

结果后来hr过来沟通说是流程太久没更新自动释放的,后来过了几天又给我恢复了。。

五面(hr面)

又隔了半个月,说是我要6月初才能任职,就往后拖了,哎无话可说
4.16 OC
4+1面终于结束了,可能lz在备胎池里一直游泳吧,也不敢说也不敢问呀哈哈

美团点评事业部 搜索与NLP团队(OC)

一面(4.8)

  • 自我介绍

  • 项目介绍(问的很细,所有的细节,包括后续上线应用在排序模型上的一些接口,上线评测指标

  • bert介绍(跟transformer差不多把,就是多了两个预训练任务

  • 梯度消失问题怎么解决(此时的lz经过腾讯的鞭打已经可以随意扯了,不得不感慨面试使人成长

  • 算法题 二叉树之字型层序遍历(5分钟搞定了 )  字典树trie类实现insert,search,startswith(5分钟搞定了)

一面面试官人很好,我们都开了摄像头,面对面的沟通交流,面试体验满分,而且最后还说我算法题做的很快,内涵了一波

二面(4.13)

  • 自我介绍

  • 项目介绍

  • 模型主要在哪些case上有很大的改进

  • 模型在哪些case还存在比较大的问题,后续想怎么改进

  • 在学校还有什么ml dl方面的学习

  • 有无论文(菜鸡,并无论文

二面也是开了摄像头的,人也很棒,说我一面面试官对我code能力有了评价,这次就不做code了,时间也差不多一个小时了,然后我问了他对我的评价,他说整体还不错,就是语速有些快,如果不是做这一行的可能没有思考时间,如果没开摄像头还以为我在读稿子。。好吧,lz就是看大张伟综艺看多了。。

求建议

美团总体面试体验肯定要比腾讯好的,但是lz也实在不甘心这样就放弃4+1的腾讯实习机会。。所以请给我看官大佬也给一些建议把。。

腾讯PCG看点   VS   美团点评事业部搜素与NLP团队
业务都是搜索推荐这一块

一起交流

想和你一起学习进步!『NewBeeNLP』目前已经建立了多个不同方向交流群(机器学习 / 深度学习 / 自然语言处理 / 搜索推荐 / 图网络 / 面试交流 / 等),名额有限,赶紧添加下方微信加入一起讨论交流吧!(注意一定要备注信息才能通过)

END -



模型压缩与蒸馏!BERT家族的瘦身之路

2021-02-26

Attention!当推荐系统遇见注意力机制

2021-02-22

FLAT——中文NER该怎么做

2021-02-19

如何兼容自训练与预训练:更高效的半监督文本分类模型

2021-02-18



推荐阅读
  • 干货 | 携程AI推理性能的自动化优化实践
    作者简介携程度假AI研发团队致力于为携程旅游事业部提供丰富的AI技术产品,其中性能优化组为AI模型提供全方位的优化方案,提升推理性能降低成本࿰ ... [详细]
  • GPT-3发布,动动手指就能自动生成代码的神器来了!
    近日,OpenAI发布了最新的NLP模型GPT-3,该模型在GitHub趋势榜上名列前茅。GPT-3使用的数据集容量达到45TB,参数个数高达1750亿,训练好的模型需要700G的硬盘空间来存储。一位开发者根据GPT-3模型上线了一个名为debuid的网站,用户只需用英语描述需求,前端代码就能自动生成。这个神奇的功能让许多程序员感到惊讶。去年,OpenAI在与世界冠军OG战队的表演赛中展示了他们的强化学习模型,在限定条件下以2:0完胜人类冠军。 ... [详细]
  • 「爆干7天7夜」入门AI人工智能学习路线一条龙,真的不能再透彻了
    前言应广大粉丝要求,今天迪迦来和大家讲解一下如何去入门人工智能,也算是迪迦对自己学习人工智能这么多年的一个总结吧,本条学习路线并不会那么 ... [详细]
  • 生成式对抗网络模型综述摘要生成式对抗网络模型(GAN)是基于深度学习的一种强大的生成模型,可以应用于计算机视觉、自然语言处理、半监督学习等重要领域。生成式对抗网络 ... [详细]
  • 深度学习中的Vision Transformer (ViT)详解
    本文详细介绍了深度学习中的Vision Transformer (ViT)方法。首先介绍了相关工作和ViT的基本原理,包括图像块嵌入、可学习的嵌入、位置嵌入和Transformer编码器等。接着讨论了ViT的张量维度变化、归纳偏置与混合架构、微调及更高分辨率等方面。最后给出了实验结果和相关代码的链接。本文的研究表明,对于CV任务,直接应用纯Transformer架构于图像块序列是可行的,无需依赖于卷积网络。 ... [详细]
  • 本博文基于《Amalgamationofproteinsequence,structureandtextualinformationforimprovingprote ... [详细]
  • 人工智能推理能力与假设检验
    最近Google的Deepmind开始研究如何让AI做数学题。这个问题的提出非常有启发,逻辑推理,发现新知识的能力应该是强人工智能出现自我意识之前最需要发展的能力。深度学习目前可以 ... [详细]
  • 推荐 :以数据驱动的方式讲故事
    直觉vs数据首先,你有思考过一个问题吗?当你的直觉与你所掌握的数据矛盾的时候,你是听从于直觉还是相信你所掌握的数据呢?201 ... [详细]
  • 深度学习与神经网络——邱锡鹏
    深度学习与神经网络——邱锡鹏-一、绪论人工智能的一个子领域神经网络:一种以(人工))神经元为基本单元的模型深度学习:一类机器学习问题,主要解决贡献度分配问题知识结构:路线图:顶 ... [详细]
  • CodeBERT理解
    1.动机大型的预训练模型,比如ELMo、GPT、Bert等提高了NLP任务的最新技术。这些预训练模型在NLP的成功驱动了多模态预训练模型,比如ViBE ... [详细]
  • 【BERT】BERT的嵌入层是如何实现的?看完你就明白了
    作者:__编译:ronghuaiyang导读非常简单直白的语言解释了BERT中的嵌入层的组成以及实现的方式。介绍在本文中,我将解释BERT ... [详细]
  • 拯救万千学子于水深火热之中!Facebook开源无梯度优化工具
    乾明发自凹非寺量子位出品|公众号QbitAI机器学习啥最苦?十有八九找参数!不少研究生,都被卡在这个环节上,久久不能毕业。现 ... [详细]
  • ACMMM 2022 | 首个针对跨语言跨模态检索的噪声鲁棒研究工作
    作者:王雅冰方向:多模态学习论文:Cross-LingualCross-ModalRetrievalwithNoise-RobustLearning录取: ... [详细]
  • Python爬虫中使用正则表达式的方法和注意事项
    本文介绍了在Python爬虫中使用正则表达式的方法和注意事项。首先解释了爬虫的四个主要步骤,并强调了正则表达式在数据处理中的重要性。然后详细介绍了正则表达式的概念和用法,包括检索、替换和过滤文本的功能。同时提到了re模块是Python内置的用于处理正则表达式的模块,并给出了使用正则表达式时需要注意的特殊字符转义和原始字符串的用法。通过本文的学习,读者可以掌握在Python爬虫中使用正则表达式的技巧和方法。 ... [详细]
  • LwebandStringTimeLimit:20001000MS(JavaOthers)MemoryLimit:6553665536K(JavaO ... [详细]
author-avatar
海滨的微博小窝
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有