注册会员
- 积分
- 177
- 威望
- 5 点
- 资产
- 950 金币
- 注册时间
- 2012-9-5
|
所有系统技术人员都应该关注 Google Spanner。如果你是工作涉及高扩展能力、高可用性的系统的程序员:大网站、云服务,或者12306,那你应该关注这个叫Spanner的项目。很多人应该已经知道Spanner了,这是一个多月前Google在OSDI会议上公开的一个分布式系统,不少人说了这个系统的好话,但是我认为你的关注多半还是不够。以下是两点原因:" b% H1 m5 j0 I: \ z B. }" i& j
5 y% b& V4 e, j+ v8 M
1. Spanner让NoSQL成了明日黄花。Spanner的特性可以认为是两个层次,上层是多数据中心自动同步(所谓全球分布,Globally-distributed),这个对大部分中国的企业可能目前阶段价值并不太大;而下层我认为非常具有实用价值,即一个可扩展、多版本、同步复制(synchronously-replicated)的数据库。这个很关键,为什么很关键?简单来说,Spanner填补了几十年来从文件系统到数据库,到NoSQL,留下的一个非常大的洞(下面说),一次性解决了一类困扰系统技术人员的问题。Spanner与各类数据系统的相对位置,可以用这样一张表粗略描述:# X. u4 a$ T Z
; D ~' y0 j' ?. m( E
; V8 c& R- x! D z* W% O8 [, h7 @. z3 D- k/ X
从这四类系统的历史演进来说,80年代现代关系数据库系统(DB2、Ingres)的成熟,是整个计算机行业的一大飞跃。而基于日志实现ACID事务,是这个飞跃的关键技术之一。然后,大家熟悉的故事是,90年代互联网出现后,对可扩展性要求越来越高,数据库技术又碰到危机,因此2005年以后才出现牺牲ACID事务,支持高可扩展性的一大批不同的NoSQL设计。这就是Spanner之前的历史,NoSQL打破了一定要ACID的定势思维,了不起,但毕竟大量应用需要ACID(比如所有涉及交易的,电商、支付、购票、广告...),那么Spanner的重要性,就是在于实现了这样一个很多人心里认为其实是做不到的事情。
6 r [' m: n. c* K* f3 P: O) a, l& O4 r4 J) b; ^3 M* X0 Y
有人会说“这不就是分布式数据库/并行数据库,研究生时我就上过这个课啊”,说对了,而且Spanner用的还就是那书里的那些办法,什么二阶段提交、Paxos算法,当然还有自创的一些小trick。但奇特的是,互联网革命已经近20年,在Spanner之前还真就没有适合互联网应用的生产用分布式数据库系统,0个,没有。不得不说科研与产业脱节不单是中国的问题啊。这里可能有些做工作的方法论的东西可讨论。# U) X( @ I% d: T) T: W8 d
6 R7 t& W; v0 ^; P& f
所以,Spanner不是另一个NoSQL系统,而可能是数据库界寻找的圣杯"Holy Grail"。Highscalability.com称Spanner为NewSQL(相对NoSQL),我觉得可能是个合适的此类系统的类别名。& V3 h5 L' d% d2 M
8 u; B' W1 s* i$ T4 m: n
2. 一年之后你将能用上Spanner。你说这东西好是好,但Google不让我们用啊。但别忘了,还有开源,我认为最快6个月,应该就会有部分实现Spanner设计的开源系统出现。Spanner的论文相对清楚,使用了很多标准算法与设计,系统在Google已经投入生产使用,并且这个系统效益巨大。因此,这些因素都使得开源实现的出现,只是一个时间问题,而且应该会比较快。9 u8 i" H" q, M$ q. L: r! U
% {% s+ M* @. u$ _, y我看到有一个在复现的模式:在计算机领域内,大公司通过实际业务需求及大量投入,推动学科最前沿往前走,并将成果与行业和学术界共享,再通过开源实现带动整个行业。这样做的公司,并不只是Google一家。5 ^4 B+ p$ B6 P2 F D6 o* J
& {% S& C+ Q, d' {所以,希望我说服了你,几年之后大规模的互联网应用,其实现将会比现在更简单,工作会更可靠,而这一切,将是感谢Spanner的贡献。虽然今天没有公开实现,但我们应该继续关注Spanner类系统。
8 Z5 b9 \4 H, f* \ i' |2 U+ ^9 z1 {. W: `: G' v
我在今年的互联网大会上分享,认为现在“任何创业公司都可以提供高质量云服务”,本文的观点是相关的,系统层的不断进度,使得应用与服务可以更容易开发,门槛不断降低。大公司、小公司需要适应这样的趋势,评估业务机会,挑选技术方案。 |
|