热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

Erlang第二课

Erlang是被设计来用在电信设备中的,这意味着需要处理大量的二进制数据。也正因为如此,Erlang把binary和binarystring提升到了一个相当高的位置,提供了极为

Erlang是被设计来用在电信设备中的,这意味着需要处理大量的二进制数据。也正因为如此,Erlang把binary和binary
string提升到了一个相当高的位置,提供了极为丰富的操作机制。当然,丰富意味着多,多了可能会有些眼花缭乱,有人给的建议是,如果感觉搞不定怎么处理bit串,可以先在shell里面慢慢的试出自己要的表达,然后copy到程序中去。

 

1、下面例子形象展示了bit 流的组装:



> Color = 16#F09A29.
15768105
> Pixel1 = <>.
<<")">>
> Pixel2 = <>.
<<154,41>>
> Pixel3 = <>.
<<240,154,41>>

我们可以看到:

>1)在定义Pixel1时,我们没有给bit串指定长度,所以,它默认是一个byte,而0x29恰好是字符“)”;

>2)在定义Pixel2时,我们指定bit串的长度是16,我们看到他把后面16位转换为bit串,即我们看到的两个8bit长数字;

>3)在定义Pixel3时,我们指定bit串的长度是24,然后我们就得到了完整的bit串-3个8bit长的bit串。

 

2、用patten matching 对bit流进行拆分,具体如下:



1> Pixels = <<213,45,132,4,76,32,76,0,0,234,32,15>>.
<<213,45,132,4,76,32,76,0,0,234,32,15>>
2> <> = Pixels.
** exception error: no match of right hand side value <<213,45,132,4,76,32,76,0,0,234,32,15>>
3> <> = Pixels.
<<213,45,132,4,76,32,76,0,0,234,32,15>>
4> <>.
<<213,45,132>>

这里的操作有:

1)表达式2并没有指定patten
matching的长度,Erlang默认按8bit处理,所以,4x8=32bit,与右边的4x24长度不匹配。即,弹出的error:no match。

2)表达式3我们指定了24-24-24-24这样的长度,与右边匹配,所以取出了<>=<<213,45,132>>.

另外,如果我们只去第一个8位,是没必要去拆开整个bit串的,Erlang给我们准备了一个语法糖:


> <> = Pixels.
<<213,45,132,4,76,32,76,0,0,234,32,15>>
> R.
213

 

3、Erlang中bit串的描述方式包括:



  • Value

  • Value:Size

  • Value/TypeSpecifierList

  • Value:Size/TypeSpecifierList

我们来具体看看这些是什么。其中,TypeSpecifierList有“Unit:xxx”,
“Type”,“Signedness”还有“Endianness”几种,使用时用(-)来隔开:

-Value. 这个bit串代表的这个数值为多少。

-Size. 这一bit串占用了多少Unit。

-Unit:xxx. xxx 取值范围是1-255,表示每Unit占的bit数。Size x
Unit为该数实际占用的bit数。

-Type.
这个属性描述了bit流是按什么方式组织的,有integer,float,binary(bytes),bitstring(bits),utf8,utf16,
and
utf32。如果没有指定格式,Erlang会默认认为他是integer类型。其中integer,float,binary默认的一个unit占1bit,我们可以用Unit来指定各个type每个unit占用几个bit;这仅仅表示它申请了这么多内存,但是存放时仅仅是在前面插了一些0。例如,



> <<8:8/unit:2>> == <<8:16>>.
true
> <<123456:16/unit:2>>.
<<0,1,226,64>>
> <<123456:32>>.
<<0,1,226,64>>

如上,“16个unit,每个unit占2bit”与“32个unit,每个unit占1bit”表示的是同样多的bit数。

-Signedness.这一属性只有两个选项signed和unsigned,默认是unsigned。同时,只有bit串是integer类型的时候,我们才会考虑这一属性。

-Endianness.可能的值有big,little,native,默认是big,而且在标准的网络协议应用中都是big
ending。同时,大小端只有在数据是integer,utf16,utf32,或者是float时有用。native取决于cpu运行时使用大端还是小端。

 举例:



1> <> = <<72,0,0,0>>.
<<72,0,0,0>>
2> Y.
1207959552
3> <> = <<72,0,0,0>>.
<<72,0,0,0>>
4> X.
72

上面的代码中:

-1中,这个bit串是integer型的,它的值为Y,Size为4,每个Unit为8位。那么,右边的bit串代表一个integer的话,这个integer的值应该是1207959552。

-3中,这个bit串同样是integer型的,它的值为X,Size为4,每个Unit为8位;但是,这个bit串是小端存放的。那么,右边的bit串如果代表一个小端存放的integer的话,这个integer的值应该是72。

 

4、bit串的运算方式有:左移(bsl,bit shift left),右移(bsr,bit shift
right),按位与(band),按位或(bor),按位亦或(bxor),按位取反(bnot)。

 

5、binary strings处理字符串要比Lists更加的节省空间,主要是Lists事实上更像是链表,而binary更像是array(a
tightly packed block of memory)。所以,在不需要对字符串进行太多处理,或者是内存比较敏感的情况下,大家更乐意用binary
string。

ps:尽管binary
string是种轻量级的方案,但是,我们还是应该尽量避免使用它来做tag。这是因为,没有什么比atom更适合做tag了,使用其它就多余了。


> <<"this is a binary string!">>.
<<"this is a binary string!">>

 

6、binary comprehension是和Lists
comprehension一样的存在。只不过,我们在描述元素属于某个bit串时,使用的符号由"<-"变成了“<=”;描述的目标是一个bit串时,我们要把最外面的“[
]”,同样换成"<<>>"。具体可以看下面两个例子:


> Pixels = <<213,45,132,64,76,32,76,0,0,234,32,15>>.
<<213,45,132,64,76,32,76,0,0,234,32,15>>
> RGB = [ {R,G,B}||<> <= Pixels ].
[{
213,45,132},{64,76,32},{76,0,0},{234,32,15}]

这样,我们轻松的把Pixels数据转化为RGB tuple的lists。注意“<> <=
Pixels”一句,8-8-8只有24个bit,而Pixels有12 X 8个bit,所以,这里处理的时候,是按描述循环取了四次。

另一个例子恰恰相反:


> <<<> || {R,G,B} <- RGB >>.
<<213,45,132,64,76,32,76,0,0,234,32,15>>

 ps:我们要注意generator返回的bit串是什么类型,忽略的话可能会出错。比如在下面例子中:


> <<<> || Bin <- [<<3,7,5,4,7>>]>>.
** exception error: bad argument
> <<<> || Bin <- [<<3,7,5,4,7>>]>>.
<<3,7,5,4,7>>

首先应该注意到,[<<3,7,5,4,7>>]是构建了一lists,其中只有一个元素,即,一个bit串。

上面的代码先是定义bit串<>,Value的类型默认是integer,即Bin是一个integer类型的数,然后尝试把generator产生的bit串赋值给Bin...等等,这就是bad
argument的根源所在。

第二次,我们声明Bin的Value是binary类型的,所以,我们成功的接收了这个bit串。

 

更多关于bit串的处理,参见: >http://user.it.uu.se/~pergu/papers/erlang05.pdf
 

Erlang第二课,布布扣,bubuko.com


推荐阅读
  • 如果应用程序经常播放密集、急促而又短暂的音效(如游戏音效)那么使用MediaPlayer显得有些不太适合了。因为MediaPlayer存在如下缺点:1)延时时间较长,且资源占用率高 ... [详细]
  • 网络爬虫的规范与限制
    本文探讨了网络爬虫引发的问题及其解决方案,重点介绍了Robots协议的作用和使用方法,旨在为网络爬虫的合理使用提供指导。 ... [详细]
  • 解决Bootstrap DataTable Ajax请求重复问题
    在最近的一个项目中,我们使用了JQuery DataTable进行数据展示,虽然使用起来非常方便,但在测试过程中发现了一个问题:当查询条件改变时,有时查询结果的数据不正确。通过FireBug调试发现,点击搜索按钮时,会发送两次Ajax请求,一次是原条件的请求,一次是新条件的请求。 ... [详细]
  • 本文介绍了如何在 ASP.NET 中设置 Excel 单元格格式为文本,获取多个单元格区域并作为表头,以及进行单元格合并、赋值、格式设置等操作。 ... [详细]
  • LDAP服务器配置与管理
    本文介绍如何通过安装和配置SSSD服务来统一管理用户账户信息,并实现其他系统的登录调用。通过图形化交互界面配置LDAP服务器,确保用户账户信息的集中管理和安全访问。 ... [详细]
  • ZooKeeper 入门指南
    本文将详细介绍ZooKeeper的工作机制、特点、数据结构以及常见的应用场景,包括统一命名服务、统一配置管理、统一集群管理、服务器动态上下线和软负载均衡。 ... [详细]
  • 两个条件,组合控制#if($query_string~*modviewthread&t(&extra(.*)))?$)#{#set$itid$1;#rewrite^ ... [详细]
  • 本文详细介绍了DMA控制器如何通过映射表处理来自外设的请求,包括映射表的设计和实现方法。 ... [详细]
  • 解决Win10下MySQL连接问题:Navicat 2003无法连接到本地MySQL服务器(10061)
    本文介绍如何在Windows 10环境下解决Navicat 2003无法连接到本地MySQL服务器的问题,包括启动MySQL服务和检查配置文件的方法。 ... [详细]
  • 本文详细介绍了如何利用Duilib界面库开发窗体动画效果,包括基本思路和技术细节。这些方法不仅适用于Duilib,还可以扩展到其他类似的界面开发工具。 ... [详细]
  • Spark中使用map或flatMap将DataSet[A]转换为DataSet[B]时Schema变为Binary的问题及解决方案
    本文探讨了在使用Spark的map或flatMap算子将一个数据集转换为另一个数据集时,遇到的Schema变为Binary的问题,并提供了详细的解决方案。 ... [详细]
  • 第二十五天接口、多态
    1.java是面向对象的语言。设计模式:接口接口类是从java里衍生出来的,不是python原生支持的主要用于继承里多继承抽象类是python原生支持的主要用于继承里的单继承但是接 ... [详细]
  • 解决Parallels Desktop错误15265的方法
    本文详细介绍了在使用Parallels Desktop时遇到错误15265的多种解决方案,包括检查网络连接、关闭代理服务器和修改主机文件等步骤。 ... [详细]
  • 解决 Windows Server 2016 网络连接问题
    本文详细介绍了如何解决 Windows Server 2016 在使用无线网络 (WLAN) 和有线网络 (以太网) 时遇到的连接问题。包括添加必要的功能和安装正确的驱动程序。 ... [详细]
  • 使用Jsoup解析并遍历HTML文档时,该库能够高效地生成一个清晰、规范的解析树,即使源HTML文档存在格式问题。Jsoup具备强大的容错能力,能够处理多种异常情况,如未闭合的标签等,确保解析结果的准确性和完整性。 ... [详细]
author-avatar
kenan0072010
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有