小塌客

石头的博客

Category "linux"

MongoDB Beijing 2011

MongoDB Beijing 2011已经结束好几天了,最近一直很忙,没时间来记录,今天使劲挤终于挤出了时间,下面简单说下整个过程吧。

 

会上用同事的iPhone 4拍了几张照片,照片不怎么清楚,主要光线的原因,

 

下午一点半到了会场,签到,拿纸和笔(让做笔记用)还有宣传小册,宣传小册上有一些mongodb的命令,挺专业的,门口图灵和华章两个出版社都摆了坛子,必须都是计算机类的图书了,凑到图灵的摊前看了看,发现了Pro HTML5 Programming这本书,正打算打印这本书的英文版呢,没想到这里居然遇到了,当然是中文版的,正要买,图灵说不卖,这是待会抽奖的赠品,赠品!?活了25年从来和赠品没什么关系,好吧,回去花钱到网上订。

 

进会场发现座位几乎已经坐满了,等了大概10分钟开始了,两个老外,一个是10gen(MongoDB背后的公司)亚洲区的产品xx, 另一个貌似也是产品xxx,英语没听清楚,

 

开场先是感谢CSDN..,靠,居然不感谢CCTV,不想在中国混了...

http://www.ccok.me/photo/image/74/medium/IMG_0204.jpg

上面是华丽丽的吊灯,我的眼。。。

 

http://www.ccok.me/photo/image/73/medium/IMG_0201.jpg

会场

 

开场主要由两个老外来做PPT,一个是说什么是MongoDB的,另一个主要是说一些高级应用的,如scaling, replica sets, sharding和performance相关的内容。

 

http://www.ccok.me/photo/image/75/medium/IMG_0205.jpg

在讲MongoDB入门的东西,什么是MongoDB,MongoDB和传统RDBMS的关系,模式设计,MongoDB的限制,事物,map/reduce, capped collection, tailable cursors, GEO indexing,以及一些简单的查询举例,现场还show了一下mongodb的下载和安装有多么的简单和快捷

 

在说到MongoDB的性能时,PPT只说了MongoDB是用C++编写的,所以具有high performance, 为什么用C++写的就有好的性能呢,难道是因为C++?,我觉得这里至少应该给出一些和RDBMS的benchmark数据才更具有说服力,当然MongoDB在安装,部署,索引创建,插入,查询等许多方面的确都比RDBMS有很多的优势,但大部分没有接触过NoSQL的人更关注的还是和当前RDBMS的性能比较,至于好不好用不是第一要考虑的问题。

 

至于和其他NoSQL的对比没有任何说明。

 

shitou听到的几点重要的是(之前还不知道的):

1) 已经删除的collection表空间虽然在磁盘空间占用中不会释放(类似于MySQL InnoDB的表空间),但会被之后的新数据重新利用。

2) 在将要发布的1.8 版本中单document的大小限制会从4M提升到16M。

 

然后就是提问时间,问的问题一个没听清。。。

 

http://www.ccok.me/photo/image/76/medium/IMG_0206.jpg

下面NO. 2老外上台(其实中间他还客串了一下帮NO. 1举话筒)

 

这个讲内容挺多的,都是一些比较高级的主题,比如

  • Scaling mongodb
  • Linked model design or embed document
  • Data model effects performance
  • Any performance problem can be resolved by changing schema
Scaling mongodb主要就是说的mongodb的master/slave, master/master, replica sets, shading等特性,说目前不推荐在production中使用master/master的模式。

 

由于mongodb是基于JSON的存储方式,所以你可以随意设计你的数据结构,“Just do whatever you want to do",这是官方的说法,不过究竟嵌套文档的层次有多深这个只有自己去做测试,目前shitou在项目中嵌套已经达到6,7层了,性能仍有不错的表现。

 

从“Any performance problem can be resolved by changing schema”可以看出mongodb对自己在简单存储模式(没有大量sub-document)下海量数据的查询还是很有信心的,shitou之前做个测试在400w数据查询的时候性能表现的确不错,感兴趣的同学可以看这里(亿级测试)

 

好了,中场休息,有吃的,盘子在哪儿?

 

下面就是几个公司的交流PPT, 换场地,分两场同时进行PPT演讲, shitou所在的公司在另一个大厅,
http://www.ccok.me/photo/image/77/medium/IMG_0218.jpg
这是shitou的同事在做PPT,之后就是提问,感觉大家还是对查询,数据量这类问题比较感兴趣,不多说了。

 

下面是同事的PPT,摸我