热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

用户画像常用方法(相关论文)

文章目录1.英文文献1.1UserProfileExtractionfromTwitterforPersonalizedNewsRecommendation(2014)1.2AFr

文章目录

    • 1.英文文献
      • 1.1 User Profile Extraction from Twitter for Personalized News Recommendation(2014)
      • 1.2 A Framework for Interaction-driven User Modeling of Mobile


1.英文文献


1.1 User Profile Extraction from Twitter for Personalized News Recommendation(2014)

摘要:news recommendation 中使用的较多的用户画像方法是从用户读过的article获取信息,如title,text,click-through data。本文探索一种新的用户画像方法,数据来源是tweets,re-tweets,hashtags,从这些数据中提取keywords 来构建用户画像。(数据来源的创新)
1. introduction:在推荐的两种方法(基于协同过滤的推荐和基于内容的推荐)中,一般来说基于协同过滤的方法比基于内容的方法表现好。但在一些特定的领域如news recommendation领域,基于内容的方法要优于协同过滤方法。原因(1)在news recommendation中,如果要将新的news推荐给用户,协同过滤方法不能马上推荐,需要先等待用户点击news以产生点击记录,然后才能推荐给其他用户,在news recommendation中,对news的实时性有要求,使用协同过滤方法不能实时地把news推荐给用户。而基于内容的方法可实时推荐,不需要等待。
(2)基于协同过滤的方法存在“cold start”问题,当一些news不存在点击记录时,不能将news推荐给用户。而基于内容的方法不存在item的冷启动问题。
2.related work:本文使用了topic model 和tfidf.其中使用topic model来比较news title的相似性。
3.proposed method:news recommendation的步骤有两个。(1)user profile (2)news ranking。本文围绕这两个部分展开,先进行用户画像,再进行news的推荐。

1.2 A Framework for Interaction-driven User Modeling of Mobile

(提出了一个扩展用户画像的框架(创新1)–>考虑用户的阅读模式,即作者提出来的6个要素,接着用几种方法(求解方法无创新)来求解这些要素,设计了一个app来收集用户阅读模式相关数据。
并没有通过用户的阅读模式6要素来进行推荐。)
摘要:在news推荐中,用户读了哪些内容对于推荐效果来说是重要的(用户兴趣)(多数研究使用的方式),用户以某种模式浏览、阅读内容(如阅读频率,阅读的类别分布等)(阅读模式)(交互习惯和偏好)(少有研究考虑)也同样重要
作者提出了一个框架来扩展用户画像,这个框架用以对阅读模式模式进行建模(此框架并不对用户兴趣进行建模)。在进行扩展画像过程中使用了多种方法,如:推测、变换函数、有监督学习方法。
贡献(1)对用户画像进行扩展。(2)在多种方法上对提出的用户画像进行测试,并讨论此用户画像如何应用在个性化新闻推荐app中。
our work:很多推荐算法(如协同过滤、基于内容的算法、混合算法)被提了出来,但对用户阅读模式进行建模的算法还比较少。
在我们之前的work中,我们识别出了三种用户类型,在以前work的基础上,我们提出了层次框架模型,能够分析mobile-sensing数据,以进行用户建模。层次框架过程如下:手机原始数据、简单处理变成low-level特征、函数变换转化成用户画像中阅读模式6要素。
六要素如下:
频率:一天之中多少次阅读?
花费时间:花费在新闻阅读中的时间?(1小时?2小时?)
阅读时间段:喜欢在哪个时间段阅读?(早上、中午,晚上?)
阅读习惯:粗读?细读?
浏览策略:从某一板块选择点击新闻?浏览全部板块点击新闻?(计算两个指标,一个是用户在所有会话中都浏览过的新闻类型(代表着用户的类型偏好),另一个是用户指在某个回话中点击过的新闻类型(代表着用户是只浏览了少数类型还是浏览了多数类别),从而知道用户的浏览策略。)
地点:家中?单位?室外?
4、buiding user profile:
4.1 data collection:作者为了测试自己提出的算法,设计了一个APP–Habito News,在谷歌软件商店中上架,主要对象是大学生社交网络写手,但因为软件已上架,也不排除有其他的一些人员。作者最终选定了47名用户。(用户至少要使用这个app两周,这样才能收集足够的数据。)用户阅读模式建模所需要的数据都来自于这个app。
app用户在安装Habito News时会被要求填一个表格和做一个问卷。表格包括性别、年龄等人口统计学信息。问卷包括了以下6个问题(每个问题是单项选择):
(1) How often do you read news on your mobile device? [a.
Many times b. Once c. Occasionally]
(2) How much time a day do you spend reading news on
your mobile device? [a. 0-5 min b. 5-10 min c. 10+ min]
(3) How do you look for stories of interest? [a. All b. Particular c. Both]
(4) How do you read a news story? [a. Detailed b. Skimming c. Scanning]
(5) Where do you often read news? [a. Home b. Work c.
Public Transport]
(6) What time of the day do you usually read news? [a.
Morning b. Afternoon c.Evening]
这6个问题对应着6个用户阅读模式factor。
4.2 modeling the six factors
对于频率、阅读时间、阅读时间段,可以比较容易地得出来,但对于其余三个factors,作者使用三种方法进行学习,前两种方法效果没有baseline(在类别中,全都预测为最多的那一类)好,第三种是监督学习方法,对3个factor中的每一个都训练一个随机森林(RF)分类器。
分类的结果:
在这里插入图片描述
4.2.1 Preparing the datasets for the analysis:
收集到的数据存在“缺失值”,地理位置没有缺失值,但其余的数据可能具有缺失值,因为用户是根据自己的需求来阅读新闻。刚开始选择了47个用户,有些用户缺乏必要的值,删去了,还剩33个用户。还有些用户下载软件不久就卸载了,这样的用户也删除。最后,作者的数据包括198天的数据(所有用户的天数加在一起),103个特征字段。


推荐阅读
  • 在处理大规模并发请求时,传统的多线程或多进程模型往往无法有效解决性能瓶颈问题。尽管它们在处理小规模任务时能提升效率,但在高并发场景下,系统资源的过度消耗和上下文切换的开销会显著降低整体性能。相比之下,Python 的 `asyncio` 模块通过协程提供了一种轻量级且高效的并发解决方案。本文将深入解析 `asyncio` 模块的原理及其在实际应用中的优化技巧,帮助开发者更好地利用协程技术提升程序性能。 ... [详细]
  • Android 图像色彩处理技术详解
    本文详细探讨了 Android 平台上的图像色彩处理技术,重点介绍了如何通过模仿美图秀秀的交互方式,利用 SeekBar 实现对图片颜色的精细调整。文章展示了具体的布局设计和代码实现,帮助开发者更好地理解和应用图像处理技术。 ... [详细]
  • 本文深入探讨了 MXOTDLL.dll 在 C# 环境中的应用与优化策略。针对近期公司从某生物技术供应商采购的指纹识别设备,该设备提供的 DLL 文件是用 C 语言编写的。为了更好地集成到现有的 C# 系统中,我们对原生的 C 语言 DLL 进行了封装,并利用 C# 的互操作性功能实现了高效调用。此外,文章还详细分析了在实际应用中可能遇到的性能瓶颈,并提出了一系列优化措施,以确保系统的稳定性和高效运行。 ... [详细]
  • 在Hive中合理配置Map和Reduce任务的数量对于优化不同场景下的性能至关重要。本文探讨了如何控制Hive任务中的Map数量,分析了当输入数据超过128MB时是否会自动拆分,以及Map数量是否越多越好的问题。通过实际案例和实验数据,本文提供了具体的配置建议,帮助用户在不同场景下实现最佳性能。 ... [详细]
  • 在 Android 开发中,通过合理利用系统通知服务,可以显著提升应用的用户交互体验。针对 Android 8.0 及以上版本,开发者需首先创建并注册通知渠道。本文将详细介绍如何在应用中实现这一功能,包括初始化通知管理器、创建通知渠道以及发送通知的具体步骤,帮助开发者更好地理解和应用这些技术细节。 ... [详细]
  • Go语言实现Redis客户端与服务器的交互机制深入解析
    在前文对Godis v1.0版本的基础功能进行了详细介绍后,本文将重点探讨如何实现客户端与服务器之间的交互机制。通过具体代码实现,使客户端与服务器能够顺利通信,赋予项目实际运行的能力。本文将详细解析Go语言在实现这一过程中的关键技术和实现细节,帮助读者深入了解Redis客户端与服务器的交互原理。 ... [详细]
  • 2019年后蚂蚁集团与拼多多面试经验详述与深度剖析
    2019年后蚂蚁集团与拼多多面试经验详述与深度剖析 ... [详细]
  • 在Spring框架中,基于Schema的异常通知与环绕通知的实现方法具有重要的实践价值。首先,对于异常通知,需要创建一个实现ThrowsAdvice接口的通知类。尽管ThrowsAdvice接口本身不包含任何方法,但开发者需自定义方法来处理异常情况。此外,环绕通知则通过实现MethodInterceptor接口来实现,允许在方法调用前后执行特定逻辑,从而增强功能或进行必要的控制。这两种通知机制的结合使用,能够有效提升应用程序的健壮性和灵活性。 ... [详细]
  • 本文深入探讨了Spring Cloud Eureka在企业级应用中的高级使用场景及优化策略。首先,介绍了Eureka的安全配置,确保服务注册与发现过程的安全性。接着,分析了Eureka的健康检查机制,提高系统的稳定性和可靠性。随后,详细讨论了Eureka的各项参数调优技巧,以提升性能和响应速度。最后,阐述了如何实现Eureka的高可用性部署,保障服务的连续性和可用性。通过这些内容,开发者可以更好地理解和运用Eureka,提升微服务架构的整体效能。 ... [详细]
  • DHCP三层交换机设置方式全局模式和接口模式设置方式和命令resetsave回车输入yreboot输入n输入y重启后就恢复默认设置了默认用户名密码adminAdmin@huawei ... [详细]
  • 深入理解Spark框架:RDD核心概念与操作详解
    RDD是Spark框架的核心计算模型,全称为弹性分布式数据集(Resilient Distributed Dataset)。本文详细解析了RDD的基本概念、特性及其在Spark中的关键操作,包括创建、转换和行动操作等,帮助读者深入理解Spark的工作原理和优化策略。通过具体示例和代码片段,进一步阐述了如何高效利用RDD进行大数据处理。 ... [详细]
  • 本文提供了 RabbitMQ 3.7 的快速上手指南,详细介绍了环境搭建、生产者和消费者的配置与使用。通过官方教程的指引,读者可以轻松完成初步测试和实践,快速掌握 RabbitMQ 的核心功能和基本操作。 ... [详细]
  • Android ListView 自定义 CheckBox 实现列表项多选功能详解
    本文详细介绍了在Android开发中如何在ListView的每一行添加CheckBox,以实现列表项的多选功能。用户不仅可以通过点击复选框来选择项目,还可以通过点击列表的任意一行来完成选中操作,提升了用户体验和操作便捷性。同时,文章还探讨了相关的事件处理机制和布局优化技巧,帮助开发者更好地实现这一功能。 ... [详细]
  • 探讨 jBPM 数据库表结构设计的精要与实践
    探讨 jBPM 数据库表结构设计的精要与实践 ... [详细]
  • 深入RTOS实践,面对原子操作提问竟感困惑
    在实时操作系统(RTOS)的实践中,尽管已经积累了丰富的经验,但在面对原子操作的具体问题时,仍感到困惑。本文将深入探讨RTOS中的原子操作机制,分析其在多任务环境下的重要性和实现方式,并结合实际案例解析常见的问题及解决方案,帮助读者更好地理解和应用这一关键技术。 ... [详细]
author-avatar
mobiledu2502925915
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有