热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.

    WhyRedis   我们这个项目是对原有缓存系统的改进,应用场景是论坛发帖,回帖,置顶,以及操作日志等等;原有系统会有替换算法把内存缓存一部分冷数据逐渐从内存中换出,内存
 
 
 
 
Why Redis
      我们这个项目是对原有缓存系统的改进,应用场景是论坛发帖,回帖,置顶,以及操作日志等等;原有系统会有替换算法把内存缓存一部分冷数据逐渐从内存中换出,内存对象序列化为XML文件持久化到磁盘;内存缓存一方面是为了访问速度,一方面是为后端的DB分担访问压力;而XML文件缓存则是为了避免雪崩,即当系统重启的时候由于缓存没有填充完毕,大量相同的请求会冲击到后端的DB;最初接手项目的时候,被告知公司老大要求xml 文件缓存必须保留,呵呵,通过和老大沟通其实保留文件缓存就是为了解决雪崩.
原有系统的问题在什么地方?
了解原有系统的瓶颈是第一步,原有系统主要问题是:
    [1] 操作粒度过大,访问数加1这样的操作都会导致整个DataSet数据对象的序列化和反序列化
    [2] 由于DataSet本身就是一个复杂数据结构,一方面会占用更多内存,一方面序列化和反序列化都会更比简单对象更耗时
    [3] DataSet序列化XML,XML文件会有并发读写的问题,这里也是经常出现故障的点
 
这样我们就能整理出来设计的要点了:
   [1]提供内存缓存的服务
   [2]要有持久化缓存,系统重启之后,可以从持久化缓存加载到内存,避免雪崩
   [3]要解决内存对象锁和文件锁的问题
   [4]由于是从关系型DB读过来的数据,数据之间的关联关系是已经建立好的
 
 
    新方案思考的起点是从数据操作粒度, 如果沿袭之前的方案,操作粒度是整个帖子+回帖+相关帖+操作日志的DataSet对象,对于只修改一两个字段的场景成本太高;所以决定把数据操作的粒度缩小,首先把DataSet中的业务对象拆开这是第一步,这也是我们最起码要做到的,拆分之后对象容器不再使用Dataset,我们把这种粒度称为粒度①;这样拆分之后,再一次缩小粒度,目标是把粒度控制为字段级别,这里的判断依据就是业务逻辑,比如操作日志每一次读写都是一个对象,那么把它的读写粒度放在字段级别没有多大好处;但是像主帖访问次数+1这种,就很适合字段级别的粒度,我们把这种粒度称为粒度②;Memcache可以很好的解决内存缓存的问题,但是存在的问题是:1.可以很容易做到支持粒度①,但是要做到粒度②需要构造维护对象的逻辑有点麻烦,与memcache交互的次数过多; 2.在这个基础上还必须要实现持久化缓存的部分.
   如果是NoSql呢?经过对比Redis可以取代原来的内存缓存和XML文件缓存:
 [1]可以作为内存缓存使用
 [2]数据可以持久化
 [3]支持多种数据结构,可以实现操作粒度②
 
学习Redis
 
我的Redis的学习参考主要集中在:
  • 官方网站 http://redis.io/
  • Redis命令 http://redis.io/commands
  • Redis协议 http://redis.io/topics/protocol
  • NoSQLFan Redis资料汇总专题 http://blog.nosqlfan.com/html/3537.html
熟悉了命令之后,仔细阅读了Redis协议,总结在[Erlang 0019]Redis协议解读与实现(.Net & Erlang) ,通过协议的学习实际上有了一个心理底线:只要通过协议能够实现的功能,我们就可以在Client实现.NoSQLFan上汇集了很多优秀的Redis资料,我专门预留了一部分时间阅读上面的文章.
 
ServiceStack.Redis实践
   Redis的C#客户端我选择的是ServiceStack.Redis,相比Booksleeve redis-sharp等方案,它提供了一整套从Redis数据结构都强类型对象转换的机制;看一个例子来了解一下ServiceStack.Redis是如何组织数据的,我们使用的实体类定义如下:
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
 public class User
{
public User()
{
this.BlogIds = new List<long>();
}

public long Id { get; set; }
public string Name { get; set; }
public List<long> BlogIds { get; set; }
}
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
使用下面的代码片段,我们存入两条数据到Redis:
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
    using (var redisUsers = redisClient.GetTypedClient())
{
var ayende = new User { Id = redisUsers.GetNextSequence(), Name = "Oren Eini" };
var mythz = new User { Id = redisUsers.GetNextSequence(), Name = "Demis Bellot" };
redisUsers.Store(ayende);
redisUsers.Store(mythz);
}
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
我们看下Redis中的结果:
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
redis 127.0.0.1:6379[1]> keys *
1) "seq:User"
2) "ids:User"
3) "urn:user:1"
4) "urn:user:2"
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
我们逐一检查一下数据类型:
 seq:User  string   维护当前类型User的ID自增序列,用做对象唯一ID
 ids:User set        同一类型User所有对象ID的列表
 urn:user:1 string  user对象
seq:User 维护的是类型User的ID序列 redisUsers.GetNextSequence()
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
public long GetNextSequence(int incrBy)
{
return IncrementValueBy(SequenceKey, incrBy);
}
public long IncrementValue(string key)
{
return client.Incr(key);
}
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
这里的SequenceKey就是 "seq:User",然后我们通过存一个对象到Redis看另外两个key是什么作用:
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
 public T Store(T entity)
{
var urnKey = entity.CreateUrn();
this.SetEntry(urnKey, entity);

return entity;
}
//entity.CreateUrn();的结果是"urn:user:1"
public void SetEntry(string key, T value)
{
if (key == null)
throw new ArgumentNullException("key");

client.Set(key, SerializeValue(value));
client.RegisterTypeId(value);
}

internal void RegisterTypeId(T value)
{
var typeIdsSetKey = GetTypeIdsSetKey();
var id = value.GetId().ToString();

if (this.Pipeline != null)
{
var registeredTypeIdsWithinPipeline = GetRegisteredTypeIdsWithinPipeline(typeIdsSetKey);
registeredTypeIdsWithinPipeline.Add(id);
}
else
{
this.AddItemToSet(typeIdsSetKey, id);
}
}
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
这里的typedIdsSetKey 就是"ids:User
 
ids:User相当于一个索引,包含了所有同为类型User的ID;由于维护了这样一个分组信息,所以很容易实现GetAll()这样的功能;
 
在redis-cli中查询一下 get urn:user:1 返回值是JSON格式:
"{\"Id\":1,\"Name\":\"Oren Eini\",\"BlogIds\":[1]}"
 
ServiceStack.Redis 自己实现了一套序列化功能,Fastest JSON Serializer for .NET released  支持 POCO(Plain Old CLR Object)序列化.
 
   实际应用中,由于我们使用的数据是来自关系型数据库,本身包含关联关系,所以并不需要这样的对象组织方式;我们只需要把关系型数据中一对多的关系在Redis中表达出来即可;这里我扩展修改了RedisClient的实现,由于RedisClient本身已经通过partial方式分割成若干个文件,所以很容易把变动的代码集中在同一个代码文件中.具体业务对象存储,主帖和回帖会有字段级修改,所以设计成为Hash结构,其它几个子对象读写都是以对象为单位,设计成为POCO方式持久化;

使用管道Pipeline遇到的问题
 
  使用管道可以将客户端到Redis的往返次数减少,不过在使用ServiceStack.Redis的时候,遇到这样一个问题,比如要把一个List全部存储,代码不可以写成下面这样:
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
%%第一种写法 
logs.ForEach(n =>
{
pipeline.QueueCommand(r =>
{
((RedisClient)r).Store(n, n.GetObjectID(), n.GetUrnKey());
((RedisClient)r).Expire(n.GetUrnKey(), dataLifeTime);
});
});
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
而是要写成这样:
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
%%第二种写法
logs.ForEach(n =>
{

pipeline.QueueCommand(r => ((RedisClient)r).Store(n, n.ID, n.GetUrnKey()));
pipeline.QueueCommand(r => ((RedisClient)r).Expire(n.GetUrnKey(), dataLifeTime));

});
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
什么原因呢?RedisQueueCompletableOperation的AddCurrentQueuedOperation方法会在 执行CurrentQueuedOperation = null;如果按照第一种写法会丢失回调函数,这就造成有返回值在没有及时提取,后续的操作获取返回值时首先取到的是积压的结果信息,就出现了异常,而第二种写法就避免了这个问题.
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
  protected virtual void AddCurrentQueuedOperation()
{
this.QueuedCommands.Add(CurrentQueuedOperation);
CurrentQueuedOperation = null;
}
最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.
Redis工具篇
  Redis的客户端redis-cli不是太好用,退格键和箭头都不能正常使用,这个的确影响效率,还是需要找一个合适的工具,我比较喜欢这个:RedisConsole
https://github.com/ptrofimov/RedisConsole/downloads
 这个工具用来学习是很好用的,但是数据量一旦增大,左侧列表就混乱了,而且一点击就假死;所以建议只在学习阶段使用;

最近在项目中实践了一下Redis,过程中遇到并解决了若干问题,记录之.

在没有window的环境,启动一个Erlang的客户端也是一个不错的选择.
 
Web端的管理工具我选用的是 Redis Admin UI
这个ServiceStack.Redis的配套项目,修改一下web.config就能用,地址在此:http://www.servicestack.net/mythz_blog/?p=381


Redis图书资料:
[1] Big Data Glossary - O'Reilly Media
[2] The Little Redis Book by Karl Seguin
[3] Redis Cookbook (O'Reilly Media, 2011)
[4] Professional NoSQL (Wrox, 2011)
 
刚刚在NOSQLFan上看到一篇一定要转过来:
原文: http://blog.nosqlfan.com/html/3729.html

这两年Redis火得可以,Redis也常常被当作Memcached的挑战者被提到桌面上来。关于Redis与Memcached的比较更是比比皆是。然而,Redis真的在功能、性能以及内存使用效率上都超越了Memcached吗?

下面内容来自Redis作者在***上的一个回答,对应的问题是《Is memcached a dinosaur in comparison to Redis?》(相比Redis,Memcached真的过时了吗?)

  • You should not care too much about performances. Redis is faster per core with small values, but memcached is able to use multiple cores with a single executable and TCP port without help from the client. Also memcached is faster with big values in the order of 100k. Redis recently improved a lot about big values (unstable branch) but still memcached is faster in this use case. The point here is: nor one or the other will likely going to be your bottleneck for the query-per-second they can deliver.
  • 没有必要过多的关心性能,因为二者的性能都已经足够高了。由于Redis只使用单核,而Memcached可以使用多核,所以在比较上,平均每一个核上Redis在存储小数据时比Memcached性能更高。而在100k以上的数据中,Memcached性能要高于Redis,虽然Redis最近也在存储大数据的性能上进行优化,但是比起Memcached,还是稍有逊色。说了这么多,结论是,无论你使用哪一个,每秒处理请求的次数都不会成为瓶颈。(比如瓶颈可能会在网卡)
  • You should care about memory usage. For simple key-value pairs memcached is more memory efficient. If you use Redis hashes, Redis is more memory efficient. Depends on the use case.
  • 如果要说内存使用效率,使用简单的key-value存储的话,Memcached的内存利用率更高,而如果Redis采用hash结构来做key-value存储,由于其组合式的压缩,其内存利用率会高于Memcached。当然,这和你的应用场景和数据特性有关。
  • You should care about persistence and replication, two features only available in Redis. Even if your goal is to build a cache it helps that after an upgrade or a reboot your data are still there.
  • 如果你对数据持久化和数据同步有所要求,那么推荐你选择Redis,因为这两个特性Memcached都不具备。即使你只是希望在升级或者重启系统后缓存数据不会丢失,选择Redis也是明智的。
  • You should care about the kind of operations you need. In Redis there are a lot of complex operations, even just considering the caching use case, you often can do a lot more in a single operation, without requiring data to be processed client side (a lot of I/O is sometimes needed). This operations are often as fast as plain GET and SET. So if you don’t need just GEt/SET but more complex things Redis can help a lot (think at timeline caching).
  • 当然,最后还得说到你的具体应用需求。Redis相比Memcached来说,拥有更多的数据结构和并支持更丰富的数据操作,通常在Memcached里,你需要将数据拿到客户端来进行类似的修改再set回去。这大大增加了网络IO的次数和数据体积。在Redis中,这些复杂的操作通常和一般的GET/SET一样高效。所以,如果你需要缓存能够支持更复杂的结构和操作,那么Redis会是不错的选择。

推荐阅读
  • 本文介绍了Java工具类库Hutool,该工具包封装了对文件、流、加密解密、转码、正则、线程、XML等JDK方法的封装,并提供了各种Util工具类。同时,还介绍了Hutool的组件,包括动态代理、布隆过滤、缓存、定时任务等功能。该工具包可以简化Java代码,提高开发效率。 ... [详细]
  • Mac OS 升级到11.2.2 Eclipse打不开了,报错Failed to create the Java Virtual Machine
    本文介绍了在Mac OS升级到11.2.2版本后,使用Eclipse打开时出现报错Failed to create the Java Virtual Machine的问题,并提供了解决方法。 ... [详细]
  • 本文介绍了使用PHP实现断点续传乱序合并文件的方法和源码。由于网络原因,文件需要分割成多个部分发送,因此无法按顺序接收。文章中提供了merge2.php的源码,通过使用shuffle函数打乱文件读取顺序,实现了乱序合并文件的功能。同时,还介绍了filesize、glob、unlink、fopen等相关函数的使用。阅读本文可以了解如何使用PHP实现断点续传乱序合并文件的具体步骤。 ... [详细]
  • 本文详细介绍了Linux中进程控制块PCBtask_struct结构体的结构和作用,包括进程状态、进程号、待处理信号、进程地址空间、调度标志、锁深度、基本时间片、调度策略以及内存管理信息等方面的内容。阅读本文可以更加深入地了解Linux进程管理的原理和机制。 ... [详细]
  • 图解redis的持久化存储机制RDB和AOF的原理和优缺点
    本文通过图解的方式介绍了redis的持久化存储机制RDB和AOF的原理和优缺点。RDB是将redis内存中的数据保存为快照文件,恢复速度较快但不支持拉链式快照。AOF是将操作日志保存到磁盘,实时存储数据但恢复速度较慢。文章详细分析了两种机制的优缺点,帮助读者更好地理解redis的持久化存储策略。 ... [详细]
  • 计算机存储系统的层次结构及其优势
    本文介绍了计算机存储系统的层次结构,包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体,形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低,使得整体存储系统的平均价格降低。同时,高速缓存的存取速度可以和CPU的工作速度相匹配,进一步提高程序执行效率。 ... [详细]
  • 本文介绍了计算机网络的定义和通信流程,包括客户端编译文件、二进制转换、三层路由设备等。同时,还介绍了计算机网络中常用的关键词,如MAC地址和IP地址。 ... [详细]
  • 本文介绍了通过ABAP开发往外网发邮件的需求,并提供了配置和代码整理的资料。其中包括了配置SAP邮件服务器的步骤和ABAP写发送邮件代码的过程。通过RZ10配置参数和icm/server_port_1的设定,可以实现向Sap User和外部邮件发送邮件的功能。希望对需要的开发人员有帮助。摘要长度:184字。 ... [详细]
  • CentOS 6.5安装VMware Tools及共享文件夹显示问题解决方法
    本文介绍了在CentOS 6.5上安装VMware Tools及解决共享文件夹显示问题的方法。包括清空CD/DVD使用的ISO镜像文件、创建挂载目录、改变光驱设备的读写权限等步骤。最后给出了拷贝解压VMware Tools的操作。 ... [详细]
  • 本文介绍了关于smarty自定义缓存名的解决思路,通过放弃生成缓存,直接生成html的静态页面来提高速度。同时提供了一个参考链接供参考。 ... [详细]
  • CSS3选择器的使用方法详解,提高Web开发效率和精准度
    本文详细介绍了CSS3新增的选择器方法,包括属性选择器的使用。通过CSS3选择器,可以提高Web开发的效率和精准度,使得查找元素更加方便和快捷。同时,本文还对属性选择器的各种用法进行了详细解释,并给出了相应的代码示例。通过学习本文,读者可以更好地掌握CSS3选择器的使用方法,提升自己的Web开发能力。 ... [详细]
  • android listview OnItemClickListener失效原因
    最近在做listview时发现OnItemClickListener失效的问题,经过查找发现是因为button的原因。不仅listitem中存在button会影响OnItemClickListener事件的失效,还会导致单击后listview每个item的背景改变,使得item中的所有有关焦点的事件都失效。本文给出了一个范例来说明这种情况,并提供了解决方法。 ... [详细]
  • Windows7 64位系统安装PLSQL Developer的步骤和注意事项
    本文介绍了在Windows7 64位系统上安装PLSQL Developer的步骤和注意事项。首先下载并安装PLSQL Developer,注意不要安装在默认目录下。然后下载Windows 32位的oracle instant client,并解压到指定路径。最后,按照自己的喜好对解压后的文件进行命名和压缩。 ... [详细]
  • 集成电路企业在进行跨隔离网数据交换时面临着安全性问题,传统的数据交换方式存在安全性堪忧、效率低下等问题。本文以《Ftrans跨网文件安全交换系统》为例,介绍了如何通过丰富的审批流程来满足企业的合规要求,保障数据交换的安全性。 ... [详细]
  • mac php错误日志配置方法及错误级别修改
    本文介绍了在mac环境下配置php错误日志的方法,包括修改php.ini文件和httpd.conf文件的操作步骤。同时还介绍了如何修改错误级别,以及相应的错误级别参考链接。 ... [详细]
author-avatar
robioven
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有