2008-07
10

翻译一篇技术评论社的文章,是讲memcached的连载。fcicq同学说这个东西很有用,希望大家喜欢。

发表日:2008/7/2
作者:长野雅广(Masahiro Nagano)
原文链接:http://gihyo.jp/dev/feature/01/memcached/0001

我是mixi株式会社开发部系统运营组的长野。 日常负责程序的运营。从今天开始,将分几次针对最近在Web应用的可扩展性领域 的热门话题memcached,与我公司开发部研究开发组的前坂一起, 说明其内部结构和使用。

memcached是什么?

memcached 是以LiveJournal 旗下Danga Interactive 公司的Brad Fitzpatric 为首开发的一款软件。现在已成为 mixihatenaFacebookVox、LiveJournal等众多服务中 提高Web应用扩展性的重要因素。

许多Web应用都将数据保存到RDBMS中,应用服务器从中读取数据并在浏览器中显示。 但随着数据量的增大、访问的集中,就会出现RDBMS的负担加重、数据库响应恶化、 网站显示延迟等重大影响。

这时就该memcached大显身手了。memcached是高性能的分布式内存缓存服务器。 一般的使用目的是,通过缓存数据库查询结果,减少数据库访问次数,以提高动态Web应用的速度、 提高可扩展性。

memcached-0001-01.png

图1 一般情况下memcached的用途

memcached的特征

memcached作为高速运行的分布式缓存服务器,具有以下的特点。

  • 协议简单
  • 基于libevent的事件处理
  • 内置内存存储方式
  • memcached不互相通信的分布式

协议简单

memcached的服务器客户端通信并不使用复杂的XML等格式, 而使用简单的基于文本行的协议。因此,通过telnet 也能在memcached上保存数据、取得数据。下面是例子。

$ telnet localhost 11211
Trying 127.0.0.1...
Connected to localhost.localdomain (127.0.0.1).
Escape character is '^]'.
set foo 0 0 3     (保存命令)
bar               (数据)
STORED            (结果)
get foo           (取得命令)
VALUE foo 0 3     (数据)
bar               (数据)

协议文档位于memcached的源代码内,也可以参考以下的URL。

基于libevent的事件处理

libevent是个程序库,它将Linux的epoll、BSD类操作系统的kqueue等事件处理功能 封装成统一的接口。即使对服务器的连接数增加,也能发挥O(1)的性能。 memcached使用这个libevent库,因此能在Linux、BSD、Solaris等操作系统上发挥其高性能。 关于事件处理这里就不再详细介绍,可以参考Dan Kegel的The C10K Problem。

内置内存存储方式

为了提高性能,memcached中保存的数据都存储在memcached内置的内存存储空间中。 由于数据仅存在于内存中,因此重启memcached、重启操作系统会导致全部数据消失。 另外,内容容量达到指定值之后,就基于LRU(Least Recently Used)算法自动删除不使用的缓存。 memcached本身是为缓存而设计的服务器,因此并没有过多考虑数据的永久性问题。 关于内存存储的详细信息,本连载的第二讲以后前坂会进行介绍,请届时参考。

memcached不互相通信的分布式

memcached尽管是“分布式”缓存服务器,但服务器端并没有分布式功能。 各个memcached不会互相通信以共享信息。那么,怎样进行分布式呢? 这完全取决于客户端的实现。本连载也将介绍memcached的分布式。

memcached-0001-02.png

图2 memcached的分布式

接下来简单介绍一下memcached的使用方法。

安装memcached

memcached的安装比较简单,这里稍加说明。

memcached支持许多平台。

  • Linux
  • FreeBSD
  • Solaris (memcached 1.2.5以上版本)
  • Mac OS X

另外也能安装在Windows上。这里使用Fedora Core 8进行说明。

memcached的安装

运行memcached需要本文开头介绍的libevent库。Fedora 8中有现成的rpm包, 通过yum命令安装即可。

$ sudo yum install libevent libevent-devel

memcached的源代码可以从memcached网站上下载。本文执笔时的最新版本为1.2.5。 Fedora 8虽然也包含了memcached的rpm,但版本比较老。因为源代码安装并不困难, 这里就不使用rpm了。

memcached安装与一般应用程序相同,configure、make、make install就行了。

$ wget http://www.danga.com/memcached/dist/memcached-1.2.5.tar.gz
$ tar zxf memcached-1.2.5.tar.gz
$ cd memcached-1.2.5
$ ./configure
$ make
$ sudo make install

默认情况下memcached安装到/usr/local/bin下。

memcached的启动

从终端输入以下命令,启动memcached。

$ /usr/local/bin/memcached -p 11211 -m 64m -vv
slab class   1: chunk size     88 perslab 11915
slab class   2: chunk size    112 perslab  9362
slab class   3: chunk size    144 perslab  7281
中间省略
slab class  38: chunk size 391224 perslab     2
slab class  39: chunk size 489032 perslab     2
<23 server listening
<24 send buffer was 110592, now 268435456
<24 server listening (udp)
<24 server listening (udp)
<24 server listening (udp)
<24 server listening (udp)

这里显示了调试信息。这样就在前台启动了memcached,监听TCP端口11211 最大内存使用量为64M。调试信息的内容大部分是关于存储的信息, 下次连载时具体说明。

作为daemon后台启动时,只需

$ /usr/local/bin/memcached -p 11211 -m 64m -d

这里使用的memcached启动选项的内容如下。

选项说明
-p使用的TCP端口。默认为11211
-m最大内存大小。默认为64M
-vv用very vrebose模式启动,调试信息和错误输出到控制台
-d作为daemon在后台启动

上面四个是常用的启动选项,其他还有很多,通过

$ /usr/local/bin/memcached -h

命令可以显示。许多选项可以改变memcached的各种行为, 推荐读一读。

用客户端连接

许多语言都实现了连接memcached的客户端,其中以Perl、PHP为主。 仅仅memcached网站上列出的语言就有

  • Perl
  • PHP
  • Python
  • Ruby
  • C#
  • C/C++
  • Lua

等等。

这里介绍通过mixi正在使用的Perl库链接memcached的方法。

使用Cache::Memcached

Perl的memcached客户端有

  • Cache::Memcached
  • Cache::Memcached::Fast
  • Cache::Memcached::libmemcached

等几个CPAN模块。这里介绍的Cache::Memcached是memcached的作者Brad Fitzpatric的作品, 应该算是memcached的客户端中应用最为广泛的模块了。

使用Cache::Memcached连接memcached

下面的源代码为通过Cache::Memcached连接刚才启动的memcached的例子。

#!/usr/bin/perl

use strict;
use warnings;
use Cache::Memcached;

my $key = "foo";
my $value = "bar";
my $expires = 3600; # 1 hour
my $memcached = Cache::Memcached->new({
    servers => ["127.0.0.1:11211"],
    compress_threshold => 10_000
});

$memcached->add($key, $value, $expires);
my $ret = $memcached->get($key);
print "$ret\n";

在这里,为Cache::Memcached指定了memcached服务器的IP地址和一个选项,以生成实例。 Cache::Memcached常用的选项如下所示。

选项说明
servers用数组指定memcached服务器和端口
compress_threshold数据压缩时使用的值
namespace指定添加到键的前缀

另外,Cache::Memcached通过Storable模块可以将Perl的复杂数据序列化之后再保存, 因此散列、数组、对象等都可以直接保存到memcached中。

保存数据

向memcached保存数据的方法有

  • add
  • replace
  • set

它们的使用方法都相同:

my $add = $memcached->add( '键', '值', '期限' );
my $replace = $memcached->replace( '键', '值', '期限' );
my $set = $memcached->set( '键', '值', '期限' );

向memcached保存数据时可以指定期限(秒)。不指定期限时,memcached按照LRU算法保存数据。 这三个方法的区别如下:

选项说明
add仅当存储空间中不存在键相同的数据时才保存
replace仅当存储空间中存在键相同的数据时才保存
set与add和replace不同,无论何时都保存

获取数据

获取数据可以使用get和get_multi方法。

my $val = $memcached->get('键');
my $val = $memcached->get_multi('键1', '键2', '键3', '键4', '键5');

一次取得多条数据时使用get_multi。get_multi可以非同步地同时取得多个键值, 其速度要比循环调用get快数十倍。

删除数据

删除数据使用delete方法,不过它有个独特的功能。

$memcached->delete('键', '阻塞时间(秒)');

删除第一个参数指定的键的数据。第二个参数指定一个时间值,可以禁止使用同样的键保存新数据。 此功能可以用于防止缓存数据的不完整。但是要注意,set函数忽视该阻塞,照常保存数据

增一和减一操作

可以将memcached上特定的键值作为计数器使用。

my $ret = $memcached->incr('键');
$memcached->add('键', 0) unless defined $ret;

增一和减一是原子操作,但未设置初始值时,不会自动赋成0。因此, 应当进行错误检查,必要时加入初始化操作。而且,服务器端也不会对 超过2 32时的行为进行检查。

总结

这次简单介绍了memcached,以及它的安装方法、Perl客户端Cache::Memcached的用法。 只要知道,memcached的使用方法十分简单就足够了。

下次由前坂来说明memcached的内部结构。了解memcached的内部构造, 就能知道如何使用memcached才能使Web应用的速度更上一层楼。 欢迎继续阅读下一章。



这篇文章有 44 条评论了,快来一起讨论讨论吧!
#1
memcached完全剖析
2008-07-17 13:01

[...] 阅读全文:memcached完全剖析 [...]

#2
memcached的分布式算法-Consistent Hashing | 排头兵-互联网技术开发实践
2008-07-28 22:30

[...] 接下来介绍第1次 中提到的Perl客户端函数库Cache::Memcached实现的分布式方法。 [...]

#3
» links for 2008-07-17 月光博客的网摘
2008-08-01 11:13

[...] memcached完全剖析 memcached 是以LiveJournal 旗下Danga Interactive 公司开发的一款软件。现在已成为 mixi、 hatena、 Facebook、 Vox、LiveJournal等众多服务中提高Web应用扩展性的重要因素。 (tags: programming web) [...]

#4
CY Tech Er’s Blog » memcached完全剖析–1. memcached的基础
2008-08-13 16:32

[...] 13 08月, 2008 (16:32) | memcache| By: xiao.jia memcached完全剖析–1. memcached的基础 [...]

#5
CY Tech Er’s Blog » memcached完全剖析–1. memcached的基础
2008-08-13 16:36

[...] memcached是什么? [...]

#6
CY Tech Er’s Blog » memcached全面剖析–2.理解memcached的内存存储
2008-08-13 16:38

[...] 上次的文章介绍了memcached是分布式的高速缓存服务器。 [...]

#7
CY Tech Er’s Blog » memcached全面剖析–5. memcached的应用和兼容程序
2008-08-13 16:41

[...] 第1次:http://tech.idv2.com/2008/07/10/memcached-001/ [...]

#8
CY Tech Er’s Blog » memcached全面剖析–4. memcached的分布式算法
2008-08-13 16:42

[...] 第1次:http://tech.idv2.com/2008/07/10/memcached-001/ [...]

#9
haohtml’s blog » Blog Archive » memcached完全剖析
2008-09-24 19:19

[...] memcached是什么? [...]

#10
无尘居 » Blog Archive » memcached的分布式算法-Consistent Hashing[转]
2008-10-07 13:43

[...] 接下来介绍第1次 中提到的Perl客户端函数库Cache::Memcached实现的分布式方法。 [...]

#11
User links about "libevent" on iLinkShare
2008-10-12 11:03

[...] | user-saved public links | iLinkShare 1 votesmemcached完全剖析–1. memcached的基础>> saved by F1lmJunkie 2 days ago4 votes[原] 未来分布式BBS的可能实现架构…>> saved by [...]

#12
Recent Faves Tagged With "c10k" : MyNetFaves
2008-10-22 17:51

[...] public links >> c10k memcached完全剖析–1. memcached的基础 First saved by MoonGreebs | 1 days ago PURCHASE Hi Capacity SLA UPS Battery for APC BackUPS [...]

#13
沉默年代 » memcached的分布式算法-Consistent Hashing[转]
2008-10-23 14:41

[...] 接下来介绍第1次 中提到的Perl客户端函数库Cache::Memcached实现的分布式方法。 [...]

#14
maohuibo
2008-11-05 16:30

不错好文

#16
一切皆有可能 » Blog Archive » memcache教程
2008-11-28 16:20

[...] http://tech.idv2.com/2008/07/10/memcached-001/ admin on 11月 29th, 2008 | File Under memcached | – [...]

#17
Recent Links Tagged With "c10k" - JabberTags
2009-05-25 07:34

[...] on Wed 20-5-2009 Review The C10K Problem – Part 2 Saved by betyro on Thu 14-5-2009 memcached完全剖析–1. memcached的基础 Saved by Ewans1girl on Fri 08-5-2009 C10K 問題 Saved by davedzenitis on Tue 05-5-2009 Top [...]

#18
memcached完全剖析–1. memcached的基础 « 熊的黑色森林
2009-06-01 11:58

[...] 版权声明:可以任意转载,但转载时必须标明原作者charlee、原始链接http://tech.idv2.com/2008/07/10/memcached-001/以及本声明。 [...]

#19
memcached全面剖析–3.memcached的删除机制和发展方向 « 熊的黑色森林
2009-06-01 12:05

[...] 第1次:http://tech.idv2.com/2008/07/10/memcached-001/ [...]

#20
memcached全面剖析–4. memcached的分布式算法 « 熊的黑色森林
2009-06-01 12:06

[...] 第1次:http://tech.idv2.com/2008/07/10/memcached-001/ [...]

#21
memcached全面剖析–5. memcached的应用和兼容程序 « 熊的黑色森林
2009-06-01 12:08

[...] 第1次:http://tech.idv2.com/2008/07/10/memcached-001/ [...]

#22
memcached全面剖析–PDF总结篇 « 熊的黑色森林
2009-06-01 12:10

[...] 第1章:http://tech.idv2.com/2008/07/10/memcached-001/ [...]

#23
linux下启用WordPress的memcached支持
2009-06-20 16:53

[...] memcached完全剖析–1. memcached的基础 [...]

#24
memcached全面剖析–2.理解memcached的内存存储 « ityum.net
2009-07-14 17:41

[...] 上次的文章介绍了memcached是分布式的高速缓存服务器。 [...]

#25
memcached全面剖析–3.memcached的删除机制和发展方向 « ityum.net
2009-07-14 17:42

[...] 第1次:http://tech.idv2.com/2008/07/10/memcached-001/ [...]

#26
memcached全面剖析–4. memcached的分布式算法 « ityum.net
2009-07-14 17:44

[...] 第1次:http://tech.idv2.com/2008/07/10/memcached-001/ [...]

#27
memcached全面剖析–5. memcached的应用和兼容程序 « ityum.net
2009-07-14 17:46

[...] 第1次:http://tech.idv2.com/2008/07/10/memcached-001/ [...]

#28
5
2009-07-20 11:20

看的不是很明白,最大只能支持4G?

#29
F1PHP
2009-07-31 11:28

FACEBOOK就使用的LAM^2P,显然最大不是4G

#30
豆瓣架构变迁:名词解释(2)-SongSaid
2009-08-01 18:21

[...] 参考:memcached, 豆瓣的subdragon维护的python客户端,c/c++客户端libmemcached, apache module mod_memcached, idv2的介绍,平凡的世界的介绍 [...]

#31
Hmily
2009-08-07 01:26

难得找到这么详细的教程,谢谢作者~

#32
charlee
2009-08-07 10:52

@Hmily 我也一起谢谢原作者 :D

#33
easyQuery
2009-08-11 01:49

点击原文链接,哇!看到全部都是Japanese,鬼子的东西博主也能翻译,这个不得不赞:-)

#34
memcached全面剖析–2.理解memcached的内存存储 » 戌狗』。『花花的博客
2009-08-18 15:17

[...] 我是mixi株式会社研究开发组的前坂徹。 上次的文章介绍了memcached是分布式的高速缓存服务器。本次将介绍memcached的内部构造的实现方式,以及内存的管理方式。另外,memcached的内部构造导致的弱点也将加以说明。 [...]

#35
memcached完全剖析–1. memcached的基础 « 涣熊的技术园地
2009-09-07 19:19

[...] memcached是什么? [...]

#36
memcached全面剖析–2.理解memcached的内存存储 « 涣熊的技术园地
2009-09-07 19:20

[...] 我是mixi株式会社研究开发组的前坂徹。 上次的文章介绍了memcached是分布式的高速缓存服务器。本次将介绍memcached的内部构造的实现方式,以及内存的管理方式。另外,memcached的内部构造导致的弱点也将加以说明。 [...]

#37
memcached全面剖析–3.memcached的删除机制和发展方向 « 涣熊的技术园地
2009-09-07 19:20

[...] 第1次:http://tech.idv2.com/2008/07/10/memcached-001/ [...]

#39
清晰博客 » memcached完全剖析–1. memcached的基础
2009-09-30 23:32

[...] 第1章:memcached完全剖析–1. memcached的基础 [...]

#40
深夜的蚊子
2009-10-29 18:27

相当详细了,受用了

#41
随机记事 » memcached的分布式算法-Consistent Hashing
2009-11-03 15:49

[...] 接下来介绍第1次 中提到的Perl客户端函数库Cache::Memcached实现的分布式方法。 [...]

#42
memcached info « My life
2009-11-06 16:12

[...] Internal implementation: http://tech.idv2.com/2008/07/10/memcached-001/ [...]

#43
memcached全面剖析–4. memcached的分布式算法 » 生活在别处
2009-12-29 15:56

[...] 接下来介绍第1次 中提到的Perl客户端函数库Cache::Memcached实现的分布式方法。 [...]

#44
min
2010-02-09 15:42

真是无比感谢,讲的太好了,而且不用登录就可以下载,简直无比人性化.

添加评论

Security Code: