数据管理前沿技术报告 - Renmin University of...

36
数据管理前沿技术报告

Transcript of 数据管理前沿技术报告 - Renmin University of...

Page 1: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

数据管理前沿技术报告

Page 2: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.
Page 3: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

书书书

!

!"#$

!

.%$)

B

%0

B

./

%

%&#$

!

.%$)

B

$%

B

.%

!

'()*

!

)*+,-./012

"

C$/'0%(%

$

0$..)%%D

#%

)*

&

345

'

678$%'(!9/012

"

.%$/EE%$/.%)

#%

6:.;<=.-

>?1-$/012

"

.%$/%%%)$/%%%$

#

+,-./01

!"#

$

!!!

$%&

.

$

"

@)ABC.DE.F

!

GH

!

$%%D'.

#

.

"

IJKLMNC.!"#&DEOP.F

!

QR

!

)(%%%.

#

"

F79<,

G"

43>&<@3&>,

#

!"

#

$%&%'(")%*

+

,%-%

#

./.-&

H<,

G

I*527<,

G

$

5,@J?5,

G

I*52

K

*5,

.

$

"

!"

#

$%&'()$"*+,$$-

$

./"&)"0")1/%2)(

3

$

#

4,)"'

$

5/)

6

)"

7

$%%D'.

#

.

"

*+,$$-$

#

4$&

8

9(/% L!"

#

$%&'()$":"

7

)"//%)"

7

$

;/"'"0")1/%2)(

3

$

#

:+$"$&)+2'"<='>

$

?,/"

7

@,$9)(%%%.

#

012&(%*&

!

M*;?;?<?*

G

?-+

:

<<@@<A<62

:

9<,;27*,72495;*2,5,@,<;N24O

$

P*

G

@5;5?5+P<>29<5?2;

;2

:

*>*,P2;?;?<5>5@<9*>5,@*,@3+;4*564<+<54>?

$

N?*>?*+4<

G

54@<@5+5,<N4<A263;*2,*,;?<7*<6@27

*,72495;*2,;<>?,262

GQ

&R2N<A<4

$

*;P4*,

G

+5P23;,2;2,6

Q

+*

G

,*7*>5,;<>2,29*>5,@+2>*56P<,<7*;+

$

P3;56+2

G

4<5;4*+O+5,@>?566<,

G

<+2,*,@*A*@356+

(

:

4*A5>

Q:

42;<>;*2,5,@@5;5+<>34*;

Q

&8344<,;6

Q

$

:

4*A5>

Q

4<65;<@N*;?P*

G

@5;5?5+P<<,>2,+*@<4<@5+2,<27;?<

G

4<5;<+;

:

42P6<9+*,95,

Q

5

::

6*>5;*2,+&

S?*+

:

5

:

<45,56

Q

T<+5,@+39954*T<+;?<>5;<

G

24*<+

G

<,<45;<@P

Q

P*

G

@5;5

$

;?<

:

4*A5>

Q:

42

:

<4;*<+5,@

;

Q:

<+*,;<49+27@*77<4<,><4<5+2,+

$

;?<>?566<,

G

<+*,;<>?,262

G

*<+5,@65N+5,@4<

G

365;*2,+2,

95,5

G

*,

G:

4*A5>

Q

$

5,@@<+>4*P<+;?<@*77<4<,><+27;?<>344<,;;<>?,262

G

*<+ N?*>??5,@6<;?2+<

>?566<,

G

<+&U*,566

Q

$

;?*+

:

5

:

<4

:

42A*@<+5,5>;*A<7459<N24O72495,5

G

*,

G

P*

G

@5;5

:

4*A5>

Q

2,;?<

5>;356

:

4*A5;<

:

42P6<9+&V,@<4;?*+7459<N24O

$

N<*663+;45;<+29<

:

4*A5>

Q

-

:

4<+<4A*,

G

;<>?,262

GQ

>?566<,

G

<+2,P*

G

@5;5&

3.

+

45(62

!

P*

G

@5;5

%

:

4*A5>

Q

4*+O

%

:

4*A5>

Q

5>;*A<95,5

G

<9<,;

%

:

4*A5>

Q

5;;5>O

%

:

4*A5>

Q

6<5O5

G

<

2

!

3

!

!"#$%&#'()*+,-./01234567$897':;<=

!

>

#S

9?@*

A'BCD6EF

&

GH@I(JK$LMNO'PQ

!

R2ST$UV'WXYZ[\/0]^_`

a.bcdef

&

34

!

WX12./0ghijklmn'opqr

!

stuvwxyz{

&

|}~

./0'��

"

WX��dWX��

!

��~./0����@'WXbc$WX����D6

#

I�

./0WX���������[\������WX��D6'�p:;�y

!

����g'D6

ef

&

456

!

./0

#

WXbc

#

WX�����

#

WX��

#

WX��

789:;<

!

SW/0.

!!

CSTUVWXYZ[

$

\]

#S

^UV'_

`ab78Xc

&

CST@defC`Sghij

LklmnO^[&.8[`$%o>

&

,p

$

CS

T78'(qNrs`tu]vwxy

&

uz{

$

v

w&|78Xc}~`����Y��DE78`

'(�

&$0

Z����l��`|���]���

Page 4: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

��Avw`DE78

$

��vw������N

�����

%

.%

Z�

C%

��

$

DE78`c| ¡

C�!"#s¢£¤A¥¦vw`§¨©ª

$

«¦

��vw¬­�®�¯°78����

%

.$

Z�n

$%

$

±²78³´µ��`¶·'( ¡�Av

wq¸¹º

$

��vw������»¼½78

"

5,2,

Q

9*T5;*2,

#

³¾¿½78

"

@<-*@<,;*7*>5;*2,

#

���

&

ÀÁ�evw&|78}~`��ÂÂÃ

@ÄÅÆ`ÇST

"

+9566@5;5

#

&

¾¿½

)

»¼½

)

È

¯

)

¯°.:]ÉÊÇST{vw��`��78

&

,p

$

�e78]/ÄËeÌÍ`ÎÏÐѳÒÓ

ÔÕÖ×Ø_Ù

$

]¦vw`ÚÛ��

"

:

5++*A<

:

42;<>;*2,

#

&

ÜÝ

$

��ÒÓÔÕÎϹ�Þßà

A-

»¼

*

$

+

}á`âãST

&

CST`Cä¾å

)

6æå³çèå:Ìé

$

 

¡\êëÄÇST

&

{ìíî`«¦ÇST`vw

��ïNVCST{ðVYñC`òóå

!

CST

`çèåôõ`çöST÷ø ¡§¨`»¼½³

¾¿½78ùúqN_Ù

%

CST`Cä¾å&6

æåôõ`uûåüý ¡§¨`ȯ³¯°.7

8þîÿ!C`"#

&

$%

$

Cä¾åST®Ã7

8

)

|�ð&78�'6(üý78 ¡CST`

vw��)*+C`£¤

&

$

#

VCST,-.

$

/Û0i��12Y34

`�AâãDE

$

ÜÝ*567&�l¾8:

&

9:

*

.

+

;àV

$(%%%%%

<»¼á`�A/Û0iST

@

$

Vê=>%?ÒÓÔÕ`ní.

$

@#Aà

.

ûBST>

$

¹�CDà

(%X

`�Aâã/Û0

i

%

@#Aà

)

�ûB>

$

ÚCDà`âã0iST

¹Eî

0(X&

.

#

V/FCST@

$

/FGHv2Y�AIJ

KL

&

9:

*

/

+

;àM,¦/FOP@

$%%%%%

�+

NO`PMQ°

)

à_RS&åD��ÿ»¼½T

U

$

,p�ÀV/FGHST&WXYBDE÷ø

á

$

Z[|CDà

D)X

#

D'X

+NO`\]

&

^{ì

.

�Ü_¹�`à

$

CSTab`vw

xy ¡de§¨`ÚÛ8��78cdqe

&

F

$

$

fg|�`vw��78`àh

&

/Ä$

$

i9

íàÿ/ÄjÛ8��

"

5>;*A<

:

42;<>;*2,

#

kl`

vwmßno

$

¦Ws`CST��vwmß

&

�n

«¦ÇST`ÚÛ8��ï8ppqrÿmnÎÏ

¾8.`vw��Ùs

$

ptêuvwõ`Ë�Î

Ͼ8.`vw��

&

pjÛ8��ï8]qrS

T`��_xySz`vw��KL

$

{ï8¦v

wbY|¦`��}

$

tjÛ~&î��CSTv

w¸ß�P@Á

&

,p

$

^ÚÛ8`vw��78î

jÛ8`vwmß78

$

w]�fC`78��

$

ëû�)*YfC`78£¤

&

2n

$

CST��

'

C�^

!

��

)

µ�

)

�^

)

�}

)

���,�

)

�_���'0÷^

&

�T��

�W�üý

$

Ýs�

'

C�^}~WsST

$

wôõ

/

����`L���

&

,p

$

WsSTôõfCL

���`ëû

$

�A�A³��`vwôõ¬­

&

$

#

�.��@/F$%`�æ'(

$

 ¡��

�À �AVêÔK`KL.¡$%A¢Wsÿ£

¥`

!YE

ST

$

�e$%¹�¤¥v¦J

)

§¨J

`xy

$

Zê¹r©ª«¬'î�Avwxy

&

Ü

Ý

$

�
!YE

GHüý

$

¹�ÞßàË�A]­]

®¯°O

&

.

#

V´«-.��

$

�Àüý´µ��±²

"

ÜÝ

U5><P22O

$

SN*;;<4

#

³´_`CST

$

¹�µ

¶´«A·`Kã

)

¸y

)

¹Ôº»�''¼bXë

½¾`´¿:

&

,p�eüý¹×���A`âã

DE

&

ÜÝ

$

�Àüý/ÄÀÁ`´µ±²

$

¹��

�Ë�A`âãÀÁ:

&

^$¹Â

$

ÃÄCSTWs`jÅFÆ]ST

vwxy

&

uz{

$

hu@&�A³��Çu`ST

Èu¸ÄÉÊ}@

&.%$/

C

Ë'_`

&

ÌÍÎ

'

t

ÏíÐA¥ÝsST`vwÑb¡îÒü��

$

w

«ôõÓ�Ô[`ás

&

mn

$

ñç$%#Õëè¹

ÕîCST`vwxy

$

tÖ!u×ØÙCSTv

wxy

&.%$)

/

Ë�)ÚÛ-.&78MeÜW

ÝÞøßàßOC.

)

áâC.&ÈRãä�C.

åÜÿCSTvw��$Ø«

*

)

+

$

jÅ$ØÿCS

Tôõ`#þ³ÉÊ

)

mnvw��78

%

.%$)

(

Ë�)ÚÛ'æÿ

,

CST&vw��

!

Æç78è

é

-

Úêë

*

(

+

$

jÅìØ�AvwðV`ÉÊ&��

78

%

.%$)

�@)O^³DE½?�D$%F'æ

ÿ

,

CSTÚêë

-

*

C

+

$

jÅíìî)CST78'

(³)*`£¤

&

F$

$

VCSTû�.

$

��ST@vwDEb

YaÌ`ïð

$

§¨`vw��ßÙ³78jLq

NñòCSTvw`zñ

$

bóŦCSTvw�

�xy��[|kq&ÍÀ

&

i9V�ßCST$

%hô`/õ{

$

[>üýÿCSTVöÃ

)

Ãk÷

ø�'üýûðV`vw��xy

$

÷øüýÿm

nCST��uù78

$

íàÿCSTvwmßn

o

$

tØÙÿ{no]ÝújÛ'hvw��v°

)

Page 5: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

ÝújÛª��vw��

$

i9Vû

)

ü¦ý��

ÿþ�üý³ìØ

&

7

!

+,-;=

!

./>?@;A

7&7

!

+,-;=

CSTÿ!æ"�

$

ST#8çè

$

STö$

%

&

�T�eÌé

$

CST`��¹�ül

.

ç

!

$

#

�_Sg½ST

"

P24,@*

G

*;56@5;5

#

&

��S

T+,´_àõ&'ø!"#`ð&³¸ß(¨

&

ÜÝ�_PÏ&9iDE

)

ZW[

ÀÁST

)

u�

¸)*`�ST

)

�^t²ST

)

/Û�Ä+,±²

`�ST

)

±-ST�'.Þ±

"

#,;<4,<;27S?*,

G

+

#

ST:

&

�_Sg½ST`vw/0õ+Ä{�S

T`ÀüöÃ

"

2A<4->266<>;*2,

#

³ST÷ø

&

Àüö

ÃÂÂ&öÃO`þ1Ç2Ò

&

ÜÝ

$

34öñ-

STþ1¹×]lÿí5±²`6xæ"

$

Àüö

ÃSTá��üý

$

¹�7¼±²�8`�l¾8

�p��ývwDE

%&

�9d�:;�

"

P4*

G

?;<+;

765+?6*

G

?;74<<5

::

#

*

(

+

'

¹�<s/Ä

E,@42*@

=>

d#@³b¹�`?ö

&

,p

$

�)Þ@ABC¢«

ZD�ÿ{©E;�³12`FG

!

{;�×ØV

�8êÔK`KL.

$

Vá>ÀüöÃ�8`ÀÁ

DE

$

tHIAû5ï

$

�è�8`ÀÁvw&Úà

Iÿ

&

ǦÄÀüöÃ

$

/Äç�Sg½STö`÷

ø³ôõ`vw/0+C

&

ÅÆ`STö��¦u

�JÅKì

$

,p

$

�À|�S.!"ïN

"

ÜÝ/

ÄvLM¹N¾�`OPQüýïN

*

'

+

#

&¾8Õ

D78¦ç�STö��÷ø}á

$

¹�¡î+È

34`�AKìDE

$

�pÕDàêë`u�

$

�R

���8`vwDE

&

.

#

�_¾S½ST

"

P24,5,562

G

@5;5

#

&

��S

T]^.ßZ[ÌéT½põ`

$

�ÀUV§ãW

�Xkl¹�6x`Sg½#8

&

ÜÝ

$

d#)*`

YZ&èZ

)

�A�[ST

"

ÜÝv\

)

)]&�æ

:

#)

,-^_èZ

)

�`a

)

�bcd

)

½.&_.

èi

)

økefgE

)

¹hiÑj`^k:¾S½S

T

&

�_¾S½ST`vwglö+Ä´_{�S

T`.ßZ[Ìé

&

ÜÝ

$

�Àümn

)

¦o"

)

_p

q"

/

�~S¹�í6èZ^k`rs"

$

×Ør

sªÕDùtu}%`ÎvwÕ

$

,p

$

�A`xÛ

�ê¹r©ªÚ^è

&

d#�8�
ZW[

¡/ÄÀ

Á`±²ï

"

62>5;*2,-P5+<@+<4A*><

$

\][

#

'ày

l

$

{�8`ÀÁDEñb¹×ÚÓ¹D`

\][

&

Æz¾S½ST{½lSg½

$

|¹&hbST

��÷ø

$

¦u���ÕD

&

789

!

+,-B./>?@;A

}~`©>¹l

$

vw�b

/

çÌé

!

vw`j

�]A

)

vw`��]�At²&�ADE

)

vw`

z�]j�êNï��`tu�O�l

&

^ÄCS

T�bCä¾å

)

çèå&6æå`abÌé

$

CS

Tvwj�¹×]A�O����

)

��¹×]A

�O��`DE

&

$%

$

CSTvw��b�[��

�Í`Ìé

&

�Tõö`êë

$

CST`vw�DC�ül

�.

/

!

$

#

"

+34A<*665,><

#

ôõ`vw

&

�u`^è

];�ÀÓN`d���

)

öÃ�A�O��`â

ãDE

&

ÜÝ

$

±���

822O*<

78���8`�

���

)

��èZ^è(¨�è£A`�l:

&

��

vw���x�(¨�ON�d�õ��

&

.

#

��

"

@*+>62+34<

#

ôõ`vw

&

ST��]

;�ï�qï@¡ê¹D`û5ï�����S

T

&

{�vw����»¼½

)

�üvw

)

ȯ

)

6x

k�:78õ��

&

/

#

�è

"

@*+>4*9*,5;*2,

#

ôõ`vw

&

�u`�

è];^ÄCST¸ß78`ê��å

$

}�Aq

NãÔ³;�

$

«Vbï�qï@´_�èws

$

p���A�O��`vw

&

{�vw����N

�Näd�õ��

&

$%

$

�T¦�`êë

$

CSTvw�D¹�ü

lSTvw

"

ÜÝu(STvw

)

ÀÁSTvw:

#)

��vw

"

ÜÝ

A

� ��:

#)

'ævw:

&

9

!

+,-B./CD

.%$.

$

Ë

$

¡¢LV£EOvw<ܤ¥'

櫦

&

vw§Æs¢Æ¨]î¥Bj�"`v¦

$

p2no�©úûª+gÅ\

$

CSTû�+È

Ý$

'

*

D

+

&

«nb9:§DE¬�`é"íìCST

mßxy

*

0

+

$

uz{

$

vw³¬�ðVÆÍ`¿D

&

987

!

,-./@EFGHBIA

.&$&$

!

­OÍð`¿D

STvw];�A

)

��#Õ:u�êNïÚ

%?Ô®`DE

&

$

�A`�l¾8

)

ÀÁDE

)

½¾¯°

)

�[ôL

)

W�`K²ôL:

$

i9Kì

ÿ&�AÇu`³bvwDE

$

ݱ

$

³²

&

STv

wjŬ'ST`¾¿å

)

vwå

)

¹�å

&

Page 6: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

U*

G

$&

!

W4*A5>

Q

4<65;<@;2*,@*A*@356&

±

$

!

&�AÇu`vwDE

!$

{±�

.%%0

/

Ë{µ

$

j¶b�À

/'

��STÃ

$

STöõ+

$'$

�#Õ

&

!!

DE¬�];DE'DE(¨©·¸L¹º`

6x

&

¸L¹º`TU»¼ÓN �

)

��

)

½¾

)

¿

W

)

��'ÀÁ:

&

DE¬�jŬ'ST`#¯

å

)

Â�å

)

¹�å

&

.&$&.

!

­OuÃ78`¿D

DE¬�`uÃ78»¼6xk�³¯°.

%

pSTvw`uÃ78»¼¾¿½

)

»¼½

)

�üv

w

"

@*77<4<,;*56

:

4*A5>

Q

#

�'ȯ:

&

M,DE¬�

78×Ø�Ä/õÑÃ

)

�D&6xÀPST`¬

�å

$

Å]ST`vw�b¹×Ú��

&

ÜÝ

$

�

Ú¹º`Æï�8¹�Ç�

E6*><

`STt&ý£

ST÷ø

$

�eTU¹×«��

E6*><

`vw

&

M,

STvw³DE¬�ðV�{¿D

$

Å]­O`�

X2`]�`

$

È]lÿST×ØÚw¯ª

)

¬�

ª6x³üý

&

i9§STvw`é"õØÙCSTvwmß

xy

$

pÓu×DE¬�

&

989

!

+,-JKB./CD

9:

*

$%

+

AàÿCST`¸ßno

$

{no»

¼STöÃ

)

STÃk&÷ø

)

STüý�'ST¤

É

)

�?ü

&

ý@

$

STöû¼WsST

"

ÜÝ

@5;5&

G

2A

±�

$

#

³wbST`öÃ

%

STÃk&÷

øjŸßST}~`ÊË

)

êÆ�

)

ÇÌÍOu(

:xy

%

STüý`2`]§Sg½ST&¾S½

ST@ÎÏ�O.ÐîbÑÒ`¾�³äÓ

%

pS

T¤ÉjÅ]�À¹è½

)

STÔö:78õ(²

CST`üýws

&

,p

$

VCST`��¸ßno

³_xyS@

$

Õ��Ö×ðV��³½¾STv

w`ÉÊ

&$

#

STöÃ�Ö

$

Ýs�ASTÚê¹D

`û5ï±²

"

3,;43+;<@;?*4@-

:

54;

Q

+<4A*><

#

öÃ

$

Ó�Avwñb¹×Ú���OIAÆïÎÏO

&

ÜÝ

$

ê¹D`ÀÁ±²ÆïöÃ�8`ÀÁDE

$

Ó�8`âãÀÁ¹×«Ú��

%

.

#

STÃk÷ø

�'ð&�Ö@

$

ðVYê¹D%»±²ÎÏ

)

¯�Ø

)

��+,ÎÏ:

%

/

#

STüýÀP@ðV

ZÙ¾8ÚÛ"ÎÏ

)

ü�&Ü�ÎÏ

)

ÌéÎÏ:

%

)

#

ST¤ÉÀP@¹×ðVnÓÔÕÎÏ

"

724<-

G

423,@O,2N6<@

G

<5;;5>O

#

*

$$

+

)

�ÀSTÔö±7¼

�ST}~`=>u(:

&

i9Y[ÝÞSTöÃ

)

Ãk&÷ø�'üý�

/

��Ö@`vwÉÊ

&

.&.&$

!

STßïöÃôõ`ÉÊ

VCST,-@

$

¹��À�b&���

)

à.

'±²��

)

±�����

)

d#�¸��

)

d#À

Á0i��:õ¶Ï�8`DE

&

pöÃ�e�8

Page 7: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

�ADEû

$

��]¸L�8ëï

$

�O�8ñáb

#«Ákq

)

Á¹ë+â`STÚ�Uãäå

.

]

æöÃÿ+â`ST

.

]æ­� �ÿ+â`S

T

.

Ýs+â`STàhÇ�

$

w^æç�

.

`ST]­V±{ÚÆï§è

.

+â`STäåû

ªÚÀÁ

.

.%$$

)

Ë

$,

áâû�

-

�®

$

E

::

6<

W��
*W?2,<

d#{`

*"[)

(¨qµ��tö

Ã�8`ªßÀÁDE

$

pÀÁDE��12Y�

8`âãDE

$

ÜÝéê

E6*><

��`êëJ�F

&

ªßÀÁDE`��&öÃ]V

*W?2,<

`á>ì

$

�8�iqNíî

&

pÀÁDEÆzÚ��

$

ÀÀÁ`GHu(¹�Þßà�8`IJKL

)

*

567

)

0i¾8:w¯DE

&

$%

$

Z22

G

6<

W��

À

822O*<

���8`����

$

�p���8`±

{�l¾8

)

Mïð¡�'£EÐñ:

&Z22

G

6<

W

��¡îÿ�)Þ@ABC¢«Aà`

..(%

��

�`òó

&

F$

$

�À{ì`uܹÔ

$

V�8q

&

ÔKë

ï

'

º

$

`KL.

$

vwÉÊÓ�fC

&

p��ÉÊ

jÅ]ôõäö&N�Nä^m

$

VöÃSTû

$

l

ÿê÷ø�8`vw

$

��=ùöÃO`+�³+

îúûÆeäö

&

pV�^½`;�üÓ@

$

�8b

º�Yý+âST`�þ

$

VöÃ�AST}nó

ÿ¡î�8`!¹

%

�8bºÔ®+â`ST]­

ÚX"

)

�

)

Æï§è

)

ÀÁ:

&

p�eº�`u

Ã

$

gÅM#à>�OÈ$Çu`N�Nä%Ñ

$

l

���8`�Avw&îâc&^mU�

&

.&.&.

!

Ãk÷øôõ`ÉÊ

Ãk³÷ø��®�',TU ç�(ÕST

ö)ÜVÆ&

$

tHÕDàÇ;`u�

&

ÇSTö�

�×Ø*+à�8`Ë�xÛ

$

oÝ,·`�b

)

à

,`�-

)

��`±�

)

d#..`ÀÁÌé

)

µ±²ÌÛDE

)

MïxÛ:

&

÷øêë`ÇST¹

�+°ª±²ÄSTüý&mß

&

/0��ÀÃk

µ{

)

µ.�'À02�ST1

$

¹�¶¡+ç£E

O`�AKìDE

)

2_£EO`à.3°:

%

ZW[

±²��ÀÃk4±êë4�{`§ãWST

$

¹

�¡î+°`®4ä9&µ�4µ

&

,p

$

ç�ST

ö`Ãk&÷øùú×ØÞßà�A³b`âãD

E

$

q5@A�Avw`��ôõÔ6£¤

&

»¼³

¾¿½]Ãk@��`vw��78

$

{78��

o7'�ÄÇ�HÅÆ`STö

$

��`Ùso7

ßl

&

,p

$

«¦Ä89`CST

$

| ��»¼�

O¾¿½78w�AâãDE��&õ

$

Å]mÎ

ÏO¶bý£WX`�Ovw`STöû

$

¹��

�',ÎÏ

"

6*,O5;;5>O

#

¦»¼}á`STö��

ÎÏ

$

!b¹×[|ÕD

"

4<-*@<,;*7

Q

#

໼á`�

AâãDE

$

�è:k�Avw��

&

ÜÝ

$

�)V

µW�

"

E"\

#

M,;<ÿ���8`=å>²

$

@#S�?¼g³

#!

@

$

,p

$

áâû��O�]

�ÀÒÓÔÕÕDà

))$'')0

@]AïBR`Ƽ

CD

%

Y<;76*F

W�³'æ`

Y<;76*F

CEF»¼S

T

$

ÚÎÏO�ÀÃkïNCDàÆe�8`\]

G��8`vw��

$

�Æws¨,G�û­�

Y<;76*F

CEF`Ï£

*

$.

+

&

�±

.

@`Ü_¦�Ãk÷øôõ`vw�

&

STö

$

]HI

A-

»¼`�b'æST

$

VJ

å

J#W

$

]*4;?!5;<

&

[<F

{Kÿ»¼½¸ß

%

ST

ö

.

]Ws`YB×LST

$

ëè�b

J#W

$

]*4;?

!5;<

&

[<F

&

ÎÏO�ÀÃkSTö

.

&ST

ö

$

$

¹�ÞßàSTö

$

@�8`\]

$

t��ý

vwDE

$

oÝ�A`Mïð¡&�b��:

&

U*

G

&.

!

E,<F59

:

6<274<-*@<,;*7*>5;*2,&

±

.

!

�A\][|CDÜ_

!$

ÔKëï

"

*,7249<@>2,+<,;

#

��V�bï)�²�_³°O}~`u(

$

];°Ob¶ÔJKt¦�_³®Ï`ïb便ÍÏM`

º�

&

Page 8: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

.&.&/

!

STüýôõ`ÉÊ

2n

$

/ÄCST`!"no

$

ý!"üý×}

×ØEî

&

CNO«

'

&

ST-.*�Àüý

$

¹�7

¼àCST@`(�>

)

ZÙ¾8

)

ü�¾8

)

ST

}~`Çuå�'�8�lä�:DE

&

,p

$

CS

Tüý`�CPÄ]STvwxy

&

VËçP"{

$

vwê¹Q

$

¹Q`]�8`�l¹��ÀCST

üýÚ2_àõ

&

ÜÝ

$

U5><P22O

&RF���8

`ST

$

t�Àüý�eSTõST

U5><P22O

`$

UÙs

$

pØ'ÿvwVº#Õ`WX

%

Z22

G

6<

`

E,56

Q

;*>+

]�·YZ`üýO�

$

[^³M#��

��{O�üý±��\

&

,p

$

V�8 �{O�

ûtê×�Ä+âSTvw`êÚ��

&E,56

Q

;*>+

êpÔ®�8i\±�³b6�DE

$

�¹��À

uÞüý¶]ý£±�@`6�DE

%

CST.`

�å½Þ^(¨]�_�²±��T�8`½¾Ì

>³à,�l

$

¡�8Þ^ã½¾`DE³�-

&

,

p

$

�8`�-à,DE�'�l¾8ñb¹×Ú

�²±�7¼àõ

$

�pG�vwDE��

&

CSTüýôõ`vwxyjÅö+Ä

/

�ï

)

!

|�!"no

)

6å×"N

)

+È89`üý¾

&

VCST,-.

$

R5@22

:

^H5

:

=<@3><

$

[;249

$

!4<9<6

�'

=^R5@22

:

l��`$C!"no

$

×Ø�_¸ß�O�8¸ß`ï8t�¸ßCä¾

ST

%

�n§¨`ST7¼

)

#W.Ð&

"\EW

"

Nê`';�e|�!"no

$

gÅ[|Watí

6ýüýå×

&

$

H5

:

=<@3><

`�æÜ�

ï N

A-><,;<4

*

$/

+

&

A-9<@*5,

*

$/

+

)

ç V Ü � ï N

]2M

*

$)

+

)

uÞÜ�ïN

82-863+;<4

*

$(

+

:

&

�e6å

×"NêÅ×ØabüýCST@deøÇ`

)

c

$}~dquÞ`STef

$

ëû�lÆïüýO

ígÿÈh`ÎÏÒÓÔÕ

$

�p�Àüý��C

ST@`vwDE

%

«nÅÆ`ü�

)

ijüý:¾

�qN;¦CST`Cä¾å³çèå

$

�pàh

ÿ+l896Ù`üý¾�

$

oÝ/Ä@#k½

"

+;2>?5+;*>2

:

;*9*T5;*2,

#

`ü�ïN

[!8E

*

$C

+

&i

jüýïN

[EZ

*

$'

+

:

&

CSTüýôõ`¨,ÉÊ]��ST`vw

DE

$

~,ÉÊ]G�vw��ïN�Ù

)

üýws

`ê¹l<å:

&

F$

$

gÅ+�bmnå

)

¹o(

å�'vwå`ST7¼³#W.ÐïN`àh

&

:

!

+,-./01LM

¤¥CSTvwxy`m²}f]

$

«¦êë

`ÉÊ

$

%pqø8&røå`vwmßno

$

!s(vwmß`uù78$%

&

:87

!

./01B*N

vwmß`t�2>]��î¥+â`mßß

ª³ïN

$

dmß

M<P

ST

)

IH\

ST&/ÛST

ÆèmßCSTvw

&

��2>»¼Ý.

/

>

!

$

#

lCST`;�íg78Úu

&

vw]CS

T;�`ní

$

vvwxyêסîñ°`¤¥

$

Ó

Ç;`;�ñb¹×klBw

&

ÉÊSTöÃO

)

S

TüýO

)

üýws` �OÆï��vwDE

$

É

ÊCST_xyS@öÃ

)

¸ß

)

ð&

)

{x

)

ÀÁy

�z�@vw`��

%

.

#

lde{p¸¥`vw£¤|}ïN

&

2n

!ç��~¸}îø'`vw��e�

$

$

�b

�P³$%��@

$

Ýú7¼�A*�STp�ê

ðV�Ê�è`ÉÊ

$

Ýú��Aå½/F�.p

êðV�bST`Ç�:

%

�ü�À��@

$

ÝúÈ

�£EO`DEV����Ê¥eûÑbÚ��

%

/

#

A<"WsST`[^³�AÆ�Ív�

&

¦ÄlWs³X"ST`Aõ¦

$

STvw]ûÆ

À`

&

Vê��STvw`ní.

$

¹�WsSTt

�!ý£�86x

&

$

l-.$%Ws+â`À

ÁDEpêðVÚÆï��`ÉÊ

%

Ws+â`´

µ±²DEpêðV��OU`ÉÊ:

&

:89

!

OPQ./01LM

iüî¥íàÆçCSTvwjÛ8mß%�

no

$

ݱ

/

³²

&

{no»¼vwjÛ^k�(

)

vwjÛST

�(

)

vwjÛmß78�(

)

x�(¨�(�'N

�Nä�(

(

C?ü

$

luhCSTvwmßíg

78ÚÛ

&

/&.&$

!

vwÉÊjÛ^_

vwÉÊ];/Ä�A�O��ST{`Õk

vw��`TU

&

$

Æ�ÆïÎÏOV±�@�

�ï%��

%

7¼´µ±²ST@A&A}~`'

,u(:

$

�eTU×b¹×��vw

&

vwÉÊj

Û^_

"

:

4*A5>

Q

4*+O5>;*A<92,*;24

#

�(]lÿV

¸ßCSTû

$

×ØjÛ�_îdeêUm`�O

ðbÆï`TU

&

êëTU`2`êë

$

$

Àü

öÃST]lÿ7¼+bÑÒ`ÔÕ

%

[

:

59

)

©E

E

::

)

$U��]lÿ¶Ï+6`�^��

%

�Ï\

]DE

)

��JAJK

)

����

)

��!"#J�

:Æï�l]lÿ�ÏK.�O�'DA

&

vwÉÊ

jÛ^_]{bvwmß78&N�Nä`/õ

&

Page 9: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

U*

G

&/

!

E>;*A<

:

4*A5>

Q

95,5

G

<9<,;7459<N24O27P*

G

@5;5&

±

/

!

CSTjÛ8vwmßno

!$

µÌ8���¹��}lVµ��

$

]�À��,�íµ��gl

&

ÉÊjÛ^_»2��b)`2ð

!

$

#

Vôõ�D

`;�,-@jÛ�Kî%?ÆïÎÏ`×}

&

Ü

Ý

$

©E

E

::

]­�K+â`d#ST

%

d#@��

Àõ`/Û$U]­��+â`ªßÀÁ

%

M<P

�±²]­��

822O*<+

78��+â`«¸��

:

%

.

#

l{bmß�(jÛ'ævwÉÊ`×}

&

2

n��`vwÉÊ^_78]/Äki�k<�ß

Ù

"

>2+;-2

:

;*956

G

59<-;?<24<;*>56

#

`ïN

*

$D

+

&

/&.&.

!

vwÉÊjÛST

vwÉÊjÛST

"

:

4*A5>

Q

4*+O5>;*A<5++<++-

9<,;

#

]�vwÉÊjÛ^_}á`mß�(

$

l

CST;�íg/õå±²

$

]ÚuCST;�`

[Åd�

&

ÉÊjÛSTëè;�b�b2ð

!

$

#

V

Ë�CST;�`þ(z�×ØjÛüýàvwÉ

ÊCÇ`×}

%

.

#

�b;G{bvwmß78�(

ÝúYýÇ;78`×}

&

Æï)¹��ÀJÅ`

x�ï8

"

_LE

#

��vwÉÊST

$

ÜÝ

$

�8S

TV±²ÄÆeCST;�û

$

�e;�]­&�

8iAÇu

.

Ýs�8STê2âãDE

$

Ó�A

vwÉʹ×] ¡`

%

Ýs¬'î�8iA

$

;{

Aàäå]c¢vw��`£F

)

¤e¥%TUC

Dÿ�8ST

.

¬';�`³bTU]­¹D

.

¦

Æï)

$

�À78d���vwÉÊjÛST

&W#E

"

:

4*A5>

Q

*9

:

5>;5++<++9<,;

#

*

$0

+

&

]̀#"[

"

<F

:

4<++*2,

27,<<@+5,@*@<,;*7*>5;*2,27+<>34*;

Q

#

*

.%

+

]��`

ÉÊST78

$

ý@

W#E

®�§Ò78STvwÉ

Ê

%

p

]̀#"[

 �ÉÊÔ[P"&'_`¹×åõ

¨\vwÉÊ`CÇ

&

V��ÉÊSTû

$

lÿr©©'£¢ST

$

;

{Vvw��.KvwÉÊST

$

��`ïN]¬

�çï!"

*

.$

+

&

$%

$

�¹��TvwÉÊ`êë

:(

$

®�ªn¾�¦TU`âãå³¹Âå��

ST

$

��vwÉÊ<ü

"

:

4*A5>

Q

4*+O+>24<

#

#�

$

+ÛlÇ;TUAàüÒt&î2«U�

*

..-./

+

&

/&.&/

!

vwjÛmß78

±

/

@`vwmß78�(l��CSTvw

mßnoígÿ[Å`78³mßÚu

$

ý¬vñ

ò�.

)

ï)`;�gl

!

$

#

ÚÛêë��`��gl

&

VvwmßÀP

@

$

����]ST �O�ÀµÌ8,-

$

íµ

`

$

]CST���`;�}Æ

&

ÜÝ

$

ÜÃ��

)

;2

:

-A

��

)

N24O625@

��

)

ö­!S��

)

¨ï±

��:

%

.

#

ÚÛêëST��`'ægl

&

qÙ]�_

Page 10: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

Sg½ST�O�_¾S½ST{x}á`ST×

¹��²kêë`ST��

$

$

u(ST

)

±S

T

)

�ST

)

g®GHST:

&

pVÓµÌ8,-

$

.'æ�evwST

$

wb��^z-7`'(

%

/

#

ÚÛST7¼&#W.Ð`üýgl

&

ST

üý]��CST¸ß`¬v

$

]'¼CST¯u

ÑÒ��ÀP

&

ÜÝ

$

;2

:

-A

ZÙ¾87¼

)

µå&°

±ij

)

ÚÛ¡\#ü�

)

a".Ð:

%

)

#

ÚÛjÛ�O+';Yývwmß78`

gl

&

VCSTmß,-@

$

êë��`ST³gv

w��b"êë

$

 �`78�êÇë

&

2n

$

vw

mß78»¼»¼½78

)

�üvw��78

)

vw

DE²�78

)

¬�çï!"78

)

STȯ78

:

&

vwmß78�(;×Ø�Têë`ST��

&vwÉÊSTws

$

+';�OjÛYýÇ;`

vwmß78õuhCSTvw`mß

&

lÿ��

{ìíî`vwmß78

$

i9Ñ!ÿÆçjÛ8

vw��no

$

ݱ

)

³²

$

{no¹�uhvwm

ß78`+';Yý

&

buvwmß78`��ø

ü

$

i9«Vû

)

üAà÷øKì

&

U*

G

&)

!

E>;*A<

:

4*A5>

Q

-

:

4<+<4A*,

G

7459<N24O&

±

)

!

jÛ8vw��no

!$

ÓµÌ8'æ��}lêµ'æ

$

]�À'æ"NõWsÇuDE

&

!%

VM#³[^@

$

x�(¨Ú�lx��"

$

];ç�A^Ä�ï�OÀ�A[^³M#:kê³c¢³ás`�l

$

��z?^´³

�©µ%`�"

&

!&

?;;

:

!

!!

@*

G

&>+5*6&9*;&<@3

!

.%%0

!

E#=

!

&

/&.&)

!

x�(¨

x�

*

.)-.(

+

];m�u�

"

ÜÝ12ç�A

#

`

�l2*ÿËÆe�³äÓ

$

Ó{u�;m·î¶

ó

&

x�(¨

%

"

5>>23,;5P6<+

Q

+;<9

#

]vwmß7

8�(&N�Nä�(}~`·¸

$

&vwmß78

�(]ǹÇk`

&

x�(¨V��vwmßno@

&î`U�ºÝN�NäV´«@&îU�Æè

$

¦

2*TUe�³äÍ`A&îµ%ý�©`U�

&

v

wmß78�À¾¿½�ȯõk�ST`6x

$

t

HVÌÍ`ÎϾ�.Ö×_Ù

&

mvwmß78ê

×_Ùû

$

x�(¨&Yx�³µ%�©`U�

&

x�(¨wø!"#78

)

´«-.&N�N

ä¦��CSTTU&î^mU�

$

ý»×;»2

/

>

!

�b>�ê¼mTU`×}

%

��e�½¾>

¿

"

E#=

½¾

&

#

²À]­2*ÿe�&äÍ`

×}

%

AàÇ;¶ó`×}

&

$%

$

uÃx�(¨g

ÅSTÔö

)

e�2*²_

)

vwÁ!:78`ÚÛ

&

/&.&(

!

N�Nä

^ÄCSTvwmß`N�Nä`ÌÂå

$

i

9p]JÅ`ØÙ

&

N�Nä]vw��78}%

`vw�Pd�

&

F$

$

VmßvwÀP@

$

p=ù

78]êØ`

$

Ã78�?êÿN�³´«®Ä¦

�øvw`�ųâc

&

�)³ÆÇÇ�È'ÿv

wN¥

$

õäö�ASTVöÃ

)

 �&§è:ï)

`�l

%

.%$/

C

Ë@)OD?'æ`

,

�D³Ì

Þ±�8�ADE��äÍ

-$

{äÍlÌÞ±�A

DE`öÃ

)

 �ígÿ¬�&N�Nä�P

&

^$

$

VCSTvwmßÀP@

$

M#;�Í

)

W�

³ÂÉÇ;`vwºN¥

$

§N�Näé"l�8

íg$C`vw��ÊP

&

;

!

RS./0145TU:V

CSTvwmß`¬v?ü]vwmßuù7

Page 11: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

8

&

^ÄCSTvwi\`ÌÂïð

$

§¨`vw�

�ßÙ³78jLqNñòýzñ

&

2nÑbÆ�

�×`ïN×ؤ¥³b`vwxy

$

ÕÆçïN

×b+â`kô>

&

i9«¦CSTmßÀP@)*

`vwÉʳ£¤

$

(sCSTvwmßuù78

`üý

&

iüYÏ?ü[>vwmß78AËÝÞ

&

;87

!

WXYTU

»¼½];vº�O¾¿ST�'STö

&

{

78ÆÌ®�Í�

*

.C

+

)

*

.'

+

)

Îý

*

.D

+

)

Ïf

*

.0

+

)

üê

*

/%

+

:TU»¼ST

&A-

»¼

*

$

+

]{78`�S

��ïN

$

{ïNV'æu(STûÅlÕÆ�%

½á`:Ñ�

"

<

a

3*A56<,><>65++

#

Rá»2

A

Ìê׿ü`ST

$

|]ÅlÆ<ST�²`�A

DERá³ý£

AB$

<STê׿ü

&

,p

$

A-

»

¼`ôÐ]¸¦:Ñ�@`âãJå��âc�p

G�{78�Ù

$

ÜÝ

$

Ë:Ñ�@©ïÆ�âã

JåÏÒÇë

$

ÓÎÏO¹�Þßà{âãÒ

&

&

A-

»¼êë

$

--@*A<4+*;

Q

*

/$

+

ïNV»¼u(STû

È�Õ�:Ñ�Rá»2

-

�êë`âãJåÒ

&

M,

--

çè½�ÄÿâãJå`çèå

$

ZÑèÿ

âãJå`�òüæ

$

�pÎÏO¹×�ñ6`ª

nȹàâãÒ

&

lÒÓ

--@*A<4+*;

Q

ïN`êI

$

(->62+<,<++

*

/.

+

ïNÅl³b:Ñ�@âãJåÒ

`üæ&{Jå`�òüæ�ÛÆ�

&

$%

$

&-

*,A54*5,><

*

//

+

&

R!->29

:

2+*;*2,

*

/)

+

ÔÓÿ

A-

»¼

)

--@*A<4+*;

Q

&

(->62+<,<++

ïNp'�ÄÕÖu(S

T`êI

$

È�STVÛÖ�Oÿ\'æSTûv

wêÚ��

&

{ì$%]«¦u(ST`

$

p¦Æ?ü»¼

½$%]Y×Ä´µ±²ST`'æ³��

&

´µ

±²@»2C\`âãDE

$

ÜÝ',u(

)

ü>J

å

)

ü>>�

)

±wÕÌé:

$

ÎÏO¹�ØÙjÛ

ÎÏ

*

/(

+

&ÚÛÎÏ

*

/(

+

¾�Þß³��Çu`âã

DE

&

´µ±²STvw��78ül

.

!

/ÄÜ

�%½N&±wÕ¿WN

&

/ÄÜ�%½N

*

/C-/0

+

]

;�ÀÜ�`ïNV±@`ü>³�ük�(ü>

³�(�

$

ü>³�`âãDE¹�vºV\¥`

��@

&

��ïN»¼ü>Ü�N

)

�Ü�N³ü>

��N

%

±wÕ¿WN

*

)%-))

+

];�Àü>³�`

Ú�;<TUWX±`wÕ

$

���³ü>`\]

ÕD�'[|ÕD

&

��ïNjÅ®��ÛÄ

A-

»

¼kl

$

ÉÊÎÏOØÙ±²wÕUlÒÓÔÕ�

�ÎÏ

$

ÜÝ"ÎÏ

)

_±ÎÏ

)

--

� ÎÏ:

&

ǦÄu(ST&´µ±²p¾

$

CST`»

¼½+l89

&

CST@çöST}~`Ãk÷ø

�'Çuåüý ¡{ìde«¦ÇST`ÚÛ8

��ïN�Ù

&

/

@`jÛ8vwmßnoÇ

o

$

§¨»¼78ðVôÐ]ÚÛ8ªÉÊvw�

$

wøÅÆSTÃ{`ÎÏÐÑõ�ÍÇ;`»

¼½e�

&

,p

$

CST`Cä¾å

)

çèå ¡§

¨»¼½78Ü$�c

&

;89

!

,-Z[TU

CSTvwmß���Ý=>l=Þ

$

VÝ=

>.uhvwmß`ßÅxy]ð&

)

ȯST{

`!"�'�D`¬�å

$

STȯ78U°HI

�Ægl

&

Ý=>.��;���=>ÄST`ð

&

)

�Ø&²��'Ý=>íg`¹D"

&

ëÖȯ

"

?292924

:

?*> <,>4

Q:

;*2,

#

*

)(-)0

+

)

» × È ¯

"

73,>;*2,56<,>4

Q:

;*2,

#

*

(%

+

)

¬�çï!"

*

($-(.

+

:]

��`ȯïN

&

9:

*

)D-)0

+

��ëÖȯ78ü

Díàÿ

O<

Q

-A563<

vwð&ï8�'ç(�ظ

ß78

$

È�ST¶bO³Ý=>Èê×V�8�

�`w>²�ÀP@ÕDàw>

&

¯9²�¸ß7

8ül¦�ȯ

*

(/

+

³WàȯïN

*

()-((

+

&

ý@

$

9

:

*

(/

+

íàÿÆçÚÛÛÖ²�`¦�ȯïN

$

�b76`¬�å³²�Ùn

%

9:

*

()

+

íàÿ¹

��Wàȯ78tÚÛuùg²�

%

p9:

*

((

+

«¦9:

*

()

+

`¬��®³Æ�åxy

$

íàÿ/

Ä@#2¾¾�&q¬��®`Wàȯï¥

&

$

%

$

»×ȯ�!V¸ß¯àû.Я9³v2`

DE

&

¬�çï!"]¦%Æ�STȯ78

$

ý¬

vTU]Vüæ8,-./Äçï~&Oíg`S

T!"àÇ;`áSÒ

$

tÈ�<ÿ~&O`â�

�'âàDE%

$

ê«¥%ªã�~&O`©úD

E

&

{78��Äüæ8,-.vw��`ST7

¼��

*

($

+

$

täåo(îq¡Ö

*

(C

+

&æÈç\

*

('

+

:��

&

èm{ì$%lCSTvwmßígÿÆÍ`

k4

$

Å]{78`ôÐo7�=

&

�ÛÄ»¼½7

8

$

{�78�]«¦Ë�ST`vw��pÚÛ

8`��

&

pVCST,-.

$

ýCä¾å

)

çèå

:Ì> ¡{�78Ð�é,êë

$

)¦|�;�

`vw��

$

óÿ|`ȯïNÖ×��

&

;8:

!

\:./TU

qÙ]»¼78�]ȯ78

$

­OÈ]«¦

mn`%?ÎÏõÑ!ì'8��ïN

$

)¦|`Î

ÏgÅ[|�Í��ïN

&

VCST,-@

$

.

Page 12: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

!$

]^

7&

!

B

�üvw

C

AÍSTÃ

D

³

DE

$

�vw"N

F

$

.'"

7

/

"

F

#

l

F

`ÏÒö­

C

v"N

F

VSTÃ

D

³

DE

{©ïâàws

G

"

G

"

.'"

7

/

"

F

##

HIê:8

W4

*

F

"

D

#

bG

+

#

<

!

cW4

*

F

"

DE

#

bG

+$

Ó

F

HI

!

B

�üvw

C

ý@

$

ªn

W4

*/+

^"N

F

`@#åk�

%

vw

2"~S

!

�²vw��P"

$

!

íÇvw��P"í6

CD

³

DE

}~RçÇ�Æ<��

$

Ó

D

³

DE

l� STÃ

$

­Ol� u(

C

ïN×^Äôõñ$`S./õõÍðSTvwå

&î�åpê�b}~;�å

&

�üvw

*

(D-C.

+

hÒÓÿ�ÆBÚ

$

{¾�]Æç^S.ßÙÚu

`

)

|�`

)

$�`vw��78

&

�T�üvw5

8½Íð

$

¹Ô

$

{ïN^vw~S

!

k�Yvw

��P"&vwî�`CÇ

$

¹�È�VËÆST

Ã@Ú��O;<Æ<��`TUê«c¢©ú!

"`âàws

&

¦%

$

{ïNêuvÎÏO³�b`

ÒÓÔÕ

$

| ÎÏOjLïð<ËÆ<��}%

`³b��`DE

$

{��`vw�qN��

*

C/

+

$

�ÆÌ> ¡�üvw78�bñ°`o(å

&

Å

uh�üvw��gÅØÙÄñY#�³��âã

å

*

C)

+

&

��`ñY#�»¼ò}òQñY

*

C)

+

&;S

ñY

*

C(

+

$

ñY`CÇ&áSÇu

#

"

"#!

#$

ý@

$

#

"/#

�²ò}òQüæ�O;Süæ`üæáS

$

"

²��âãå

&

2n

$

�üvw78`$%jÅÃ@

VST'æ

)

ST7¼&.Ð

)

��¸ß:ï)

&

S

T'æó�`OU»¼

!

ÆV³çV¨ï±'æï

N

*

CC-')

+

)

�ST'æ

*

'(-''

+

)

±ST'æ

*

'D-D%

+

�'B

~ST'æ

*

D$-D.

+

:

%

ST7¼³#W.Ð�S$%

»¼

!

ZÙ¾87¼

*

D/-D(

+

)

ijüý

*

DC-D'

+

)

ü�

*

DD-D0

+

:

%

p��¸ßOU»¼

!

ö­!S��

*

0%

+

)

ôõ#�`_\��

*

0$-0.

+

)

/Äö÷#�`_\�

*

0/

+

:

&

§{ì`$%¹�`à

$

�üvwjLkl2

nvw��78$%o>

&

.8[¹l�üvw&

CST�b�,`ø�å

*

0)

+

$

ý£F]CST`C

ä¾å³çèå ¡VSTÃ@æÈ�O;<Ë�

ST>¦��ST`c¢Ó�Ç

$

�ÆÌW&�ü

vwÍð`zñÇùø

&

èmÝ$

$

ǦÄi9íà`CSTvwjÛ

8mßno

$

�üvw��78~ðV`ôл¼

!

qNjÛ8ªk�vw~S

!

C

Ç`

!

G�ö¹�å

&6`vwå

$

*}

$

G�6¹�å&ö`vwå

&

F$

$

{~Sñ�k�

&

CST}~`uÞåb¹×

ú½�üvw��Ùs

&

;8;

!

./EF_`TU

vwDE²�

"

:

4*A5;<*,72495;*2,4<;4*<A56

#

*

0(

+

78��Ú�Ä%»STû`��¬�

$

�8¹�

Vê¹D`±²=>{��©ïSTpê��Ú�

�ST`âãDE

&

Ú��`ST¹�]Ws`

)

»

¼`

$

Å]±²=>ZqNCD�eST`��z

&

èm

)&.

üíî`ëÖȯ78�¹�uh¦

��`k�

$

,p

$

^Ä��`89å&!"sÀ 

¡��78ê�bu�å

&

uhvw²�`78»

¼

.

!

$

#

/ÄDEÙ`²�ïN

*

0(

+

$

{ïN��

]V³b`ST§ûA�8üt�!ýViª¤

°

$

,p^ħâ�Ñxy

$

�ç78êý'øCS

T

%

.

#

/ÄþÏ`¹!"²�ïN

$

{ïN]2no

7��`

$

���Ä

!YE

GHø�

)

/Äz�`±

d²��'ÀÁvw��:��

&

9:

*

0C-0'

+

¹!"noüD=T­�ÿËÐÑxy`�¤å&

!@#áS`¹uhåÑ!ÿêë`vwDE²�

ïN

*

0D

+

%

9:

*

00

+

íàÿÆçÅƱ²ï¹!"²

�"�

$

{"���

W5*66*<4

ȯ(¨

*

$%%

+

uhÿö

�DsÀ`g®§â

&

,p

$

{ïNZðVÙnö�

'DE��`÷Ê

*

$%$

+

%

9:

*

$%.

+

ØÙÄ

"=EH

"

"P6*A*23+=EH

#

*

$%/

+

!"íàÿÆç+ÈbÙ`

²�"�

$

{"�êÅ×Ø#ö�D³!"�Ñ

$

+

×ØÉÊDE��

&

èmvwDE²�78$�ÿ

¬�%þÏ`'(

$

ÅVCST,-@

$

�178`

;�«+È&�³89

&

;8<

!

abcd

iüjÅíìx�(¨@³¬'`!"#78

&

x�(¨;×Ø���8`ST]Ýúmß`

)

¤

eA6xÀ£¥`ST

)

STäåûªÚ¿W³Ç

�À:

$

{(¨`¬v»¼STµ�

)

2ä²_

)

S

TÔö:

&

lÿuhx�(¨

$

OU�78Ru[Å

&

OU�LÀ`þfÈb¹×Åx�

$

ÜÝ

$

Ó¹º�

�¬�(¨

)

Ó¹º²�¬�ST:

&

>�³µ�O

U�@³bST�l]x�(¨`uù

&

STÔö

]µ�ST�Lþf`��ïN

$

ý�D»¼>�

ïN

*

$%)-$%(

+

)

ST'Û`µ�ïN

*

$%C-$%'

+

)

Ãk8µ

�ïN

*

$%D

+

&üæ8µ�ïN

*

$%0-$$%

+

&

9:

*

$%)-$%(

+

��>�ïN��STVST(1@`§è³��

)�

%

9:

*

$%C-$%'

+

íàÿ

U62

GG

<4

&

[.\2

GG

<4

ïN

$

üDµ�Ýno.&ü¦ü.`STÔö

$

¹

���9Ï(¨{ST*%

)

+a�l

&

9:

*

$%C

+

wø±#,-íàÿÆçÔöÃkïN

$

Üøêë

`OU�õ��ST,_�

%

9:

*

$%0-$$%

+

íàÆ

çüæ8Ôöµ�ïN

$

��±²§è>�³bT

U

&

$%

$

tϵ�

*

$$$

+

�]µ-ST�l`��ï

Page 13: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

N

&

{ìSTÔö$%CÈ]/ÄÇä¾STÃ

$

V

;�ÄCSTÃû;×ïSTÃçX&89å�'

STW\:xy

&

2ä²_]x�(¨`¦Æ�¬

v78

&

mSTÚÇ�û

$

x�(¨;×ز_àú

¸àhÇ��l³Ç��l`�:O

&

��`²_

78»¼��²_

*

$$.-$$/

+

&¨!ø�

*

$$/

+

&

9:

*

$$.-

$$/

+

íàÿ±²"�b{`

]5>O;45>O<4

²_ï

N

$

{ïN×Øuhçj#}~`��²_&��

öµ�

%

9:

*

$$)

+

��ST`¨!¹µÔå¹²_

àÇ��l

&

2n

$

x�(¨VCST,-@mßvwðV

`ôл¼

!

ôõ.bÉÊ^_&ST`ÚÛ

%

ôõ

¹ù`N�Nä�"È�x�(¨`/�

&

<

!

./01TUefBgh

i9³íà`vwmß78nolCSTvw

mßígÿ[Å`78Úu

&

,p

$

{no�'no

@³Ãk`hbvw��78ÈðVÆÍ`£¤

&

<87

!

./01LMJKBgh

û

/

üjÅKìÿjÛ8vwmßno@y�

�(`»×�'uhÕ�»×¾0¦;`ïN³7

8

$

p{noëû�)*Y1磤&xy

&

$

#

vwÉÊjÛ^è&ST�()*`£¤

34`ST2ö]CST78'(`/õ

$

2

nî)STös�`P"o7ö

&

ÆzM#

)

[^³

�^}~�½�âpWs&X"ST

$

vwÉÊj

Û^è&jÛSTw)*YfC£¤

&

JÅ`vw

^èïNb¹×qNHIçSTöX"`gl

&

Ü

Ý

$

Ýú^èîÀüöÃST

)

ÆïüýST`�l

&TU:

&

ëû

$

_LE

(¨&

W#E

78�eJÅ`

STïN¹×qN;¦çSTöWsôõ`£¤

&

F$

$

«¦êë`STöôõ`vwÉÊ

$

Ýú�Í

|`vwST&üýe�

)

Ýú¦|`vwÉÊ�

�ü��'ÉÊ:(9ü:ÈðVñC`xy

&

.

#

vwjÛmß78�()*`£¤

vwjÛmß78�(`X!2>]VCST

��_xyS@��ývw

$

tH×Ø=TvwÉ

ÊSTwsjÛYýÇ;`��78

&

,p

$

CST

2ö`+3åWs

$

 ¡vwmß78)*|�`

vwÎÏ&vw��

$

ÜÝçöST÷øôõ`v

w¬­:

&

F$

$

ÝúÑ!;¦|�ÎϾ�`mß

78]�C`£¤

$

ÝúVÇ;`78Ãkîî¥

`jÛ8vw��no@�]�ñC£¤

&

lÿr

©jÛ8mß78Ð�&§¨78Çë`êë

$

¹

���#W.ÐïN¦Ç;`vwmß78&vw

��£F��45&.Ð

$

�pEî+';ªYý

&;¦vwÉÊ`Ùs

$

,p

$

ÝúÑ!.ÐïN�

]�£¤åxy

&

/

#

x�(¨�()*`£¤

Vx�(¨�(@

$

STÔö]µ�STTU

�l`ßl78

$

,p

$

CST`6æå&çèå:

Ì> {78X¡+È89

&

Ýú6=>

)

6��µ

�de�='_WX`STÓ�&�

&

M,STÔ

ö78¹�Kì��ST`7²

$

pV �{78

û¹×G�STvw��

&

ý£F]STÔöi\

¹×12âã`�ST

$

Vµ�ÀP@¹×«��

ý£`DE:

&

$%

$

VCST,-@

$

=ùAOõ

>�ST` �³Ç�2`êýhu

$

Ýú��¨

!ïNÑ!à+ÛCD³²_Ç��l`ïN]�

C`£¤

&

)

#

N�Nä�()*`£¤

V��CSTvwï)

$

î)hb`N�Nä

jÅ)*Y

/

�ï)`£¤

!

$

hb`N����

&

�A¹ÕDDE

'

lj

$

pVCST,-@

$

�A¹

ÕDDE`[óíõí�[Í

%

%

�Â`vw��

�"

$

ÜÝ

&

TU2`�È

$

é¡�At«ëï

)

ó�

DE �ö­

'

:

$

íõí�k�

%

&

qN¦ST6

-�Ûôõ`vw÷øAË��

&

F$

$

«¦{ì£

¤

$

ÝúÂÉ&W�2n`N�Nä])*

`xy

&

(

#

9@

.&.

üKìÿmnCST¸ß=>`

y�b�ÈðVÇ;`vw��¬­

$

pî¥íà

`jÛ8vwmßnojÅ];¦�exy

&

,p

$

ÝúVî¥Ñ!`mßno8�îhb`CSTm

ßno@]�ñC£¤

&

<89

!

RS./ijTUklBgh

û

)

üjÅüýÿmnvwmß78`kô

>

&

Vi9íà`vwmßno@

$

hbvw��

78)¦CST)*1磤

!

$

#

»¼½78)*`£¤

VCSTÃk÷ø`ÀP@

$

¾8ÍÀ

"

+>?<95

56*

G

,9<,;

#

]ý¬vTU

$

pV¾8ÍÀû

$

STö

`çèå³ÛÖ嫬'îST`ççJå

$

tH

�eST}~c$ðVÇuå

$

9RG�¾8½ð

'_T½

&

p§¨`»¼ïNqN��¾8T½`

âãJå

&

F$

$

ÝúÑ!:ÜCST`¾8çè

å

)

¾8T½&Çuå`»¼ïN]�£¤åxy

&

Page 14: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

!$!

-

�üvw`Íð

$

~Â;×Íð

$&

!!

STö}~`Çuåõ+ÄST}~ÍOu

(

$

ÍOu(��G�q<`STÔö

$

�p¹×G

�=ÐDE`ðV

&

VÃküýÀP@

$

gÅÂ�&

¹D`STö

$

v»¼ïN��ÿ=Ð`ÍOST

$

Ó¯Ò`vw¹×«��

&

F$

$

ÝúÑ!:ÜÍO

u(&µ�STÔö`»¼ïN]�ñC£¤

&

$%

$

hð`»¼ïN��ðV¹o(å�

)

!

"�Ñ6

)

»¼áST¹�å"\êäö:ôÐ

$

F

$

$

ÝúVhb`ïNo(î2n|�`!"no

@

$

ÜÝ

H5

:

=<@3><

$

[;249

&

[

:

54O

:

$

]�ñC

`£¤

&

ëû

$

�Í|`'�ÄCST»¼`DEî

�"\ïN�]�C`£¤

&

.

#

STȯ78)*`£¤

^Ĺ�§ç>®¶¡CST

$

�pVȯ
P@Ýú��ýw¯åÓ�uù

&

V¸ßCST¬

���û

$

��ÐÑÝ=>]¹D`

$

,p

$

hu;

�@ê¹D�O?¹D`Ý=>ÈuðV

&

V��

Ý=>{

$

ST¶bO`ST

)

�8��vw×b¹

×Ú��

&

ÜÝ

$

Ë/0W�VA·`��DEã�

Aê¹D`Ý=>

$

{=>b¹×V��`vwD

EIA{W�`@A¦d

&

F$

$

Ýú��¹��W

àȯ78

)

ëÖȯ78

)

»×ȯ78�'¬�

çï78õÑ!ÆçB×���8`��vw

)

S

Tvw�'5ïµÌvw`ïN]�ñC`£¤

&

V¸ßCSTuû!"û

$

�®�ëÖȯ78

$

,

p

$

2n`ëÖȯ78Ùno7ö

$

F$

$

ÝúÑ

!6Ù`uû`ëÖȯïN]Æ�C`£¤

&

¦

%

$

VCST,-.

$

"ëU^]��`78

&

¬�

çï!"78]È�"ëU^ûc$ê��vw`

jÅïN

$

,p

$

!ç/Ĭ�çï78`ïNÈ]

�Czð`

$

ÅlST�?C.Vzð@

$

p��ï

Nêר,Ú�ÄbùD�<��`CST{

&

F

$

$

Ýú��¬�çï78õÑ!Ózð`HHI

Cä¾ST"ëU^gl`ïN]�ñC`£¤

&

/

#

�üvw78)*`£¤

�üvw��`ní]ÅlSTÃ`ST]Ç

Ìap`

$

$

pCST`çèå&Cä¾å:kÿ

çöST}~`Çuå

$

�pñ��Ä�üvw7

8bÙ

&

tH

$

ÝsST�Çuåü�`5»ðV

$

ÌD�o7Cû

$

�üvw��Ùso7�

$

�pG

�hb`üý³��ïNê×ñ°ª/�îCST

,-

&

F$

$

ÝúÑ!ÚÛÇuåST'æ&��`

�üvw"N]�£¤åxy

&

CST`6æåÅl��`ï8¦ý��üý

³'æ

&

'æSTÅ+3+|

$

­ÓqNªÅ�?`

¨!DE

$

$%

$

óÿ®ÏVµ6Ù`¸ßï8t�

Ä'æws`¿Èå

&

F$

$

Ýú=TEÛv78

)

Îè78�'âcÞß78

$

Ñ!à¸ß6æ`

)

u

ûX½`CST�üvwmßnoX¡Fl[Å

&

V®��üvw��CSTû

$

ÝúGü³ü

�vw~S

!

Ó�uù

$

Fl

!

¨,¥ÍYSTvw

å&¹�å

C

7C`

!

Òú½vwåpÿ$¹�å

$

*}

$

Hú¹�åpÿ$vwå

C

puz;�@

$

!

ê×Òü=¨vwå&¹�å

C

F$

$

ÝúÑ!øß

`vw~S

!

ü�e�]�ñ�b£¤å`xy

C

)

#

vwDE²�78)*`£¤

2n

$

vwDE²�78jÅ«¦ê¹D±²

W{`vwDE��

$

ÜÝ

dYY

��

)

uùg�

)

�I4f��:

&

VCST,-@

$

�8¹��

�{78¡ê¹D±²W'���t¶¡¢;w

s

&

{ïN����DEÊË78«¦Æ�íµ`

��pAàÇ;`vw��

&

,p

$

CST`çèå

&Cä¾å ¡p=ùÆ���³¶¡`wsÓ�

ê¿È

&

�8b¹×«¦Ë���¡ê¹D±²W

íµç��Oêë58`��

$

ÜÝ��éê+â

��`�F

$

�8gÅç�/ÄvwDE²�78

`6xֹ׶¡¿È`��ws

&

VCST,-

.

$

��vwDE²�78¦�8ç��Oçè½

������û

$

gÅC\`ÊËST

$

�èG�ñ

6`!"�ѳ¢;�Ñ

&

F$

$

ÝúÑ!ëû:Ü

#ö{ì�çsÀ`ïNñ�b£¤å

&

$%

$

2nvwDE²�78��¦�8��

`z�����

$

ÑbqrÝú��±²WüST

`KL

&

p$çKLÅl�8J×��Ú¹º`S

T

$

ëû±²ígïêÔ®�8����¤eST

&

F$

$

ÝúwvwDE²�78&hbSTȯ7

8Çwøõuh�8��vw&±²WSTvw`

��]�C`£¤

&

=

!

mno

CSTVmn

#S

^'(KüLæ

$

�b$M

`'(nÓ

$

Åëûý³)*`vw£¤³ÉÊ�

]Bn`

$

gÅvw��$%OXëìlmß}®

&

Page 15: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

i9<½ÿ§¨ÚÛ8��78`âc

$

íàÿj

Û8vwmßno

$

tØÙÿ{no)*`jÅ7

8£¤

&

CSTvwmßêpp]78ï)`xy

$

\�¬'îN�Nä

)

^m¾8

)

N�:1çï)

&

F$

$

p§78b)ìØCSTvwmßxy]O

OêØ`

$

gÅ.8[

)

[^[�'M#Çu?ÎX

ëP}Ö×uh

&

p q r s

*

$

+

[N<<,<

Q

\&d-5,2,

Q

9*;

Q

!

E 92@<6724

:

42;<>;*,

G:

4*A5>

Q

*

1

+

&#,;<4,5;*2,561234,5627 V,><4;5*,;

Q

$

U3TT*,<++5,@

d,2N6<@

G

<-]5+<@[

Q

+;<9+

$

.%%.

$

$%

"

(

#!

(('('%

*

.

+

H2,;

K

2

Q

<!

$

R*@56

G

28E

$

e<46<

Q

+<, H

$

<;56&V,*

a

3<*,

;?<>42N@

!

S?<

:

4*A5>

Q

P23,@+27?395, 92P*6*;

Q

*

1

+

&

Y5;34<

$

[>*<,;*7*>=<

:

24;+

$

.%$/

$

/

"

.

#!

$(

*

/

+

[N<<,<

Q

\

$

EP3E

$

M*,,1&#@<,;*7

Q

*,

G:

54;*>*

:

5,;+*,;?<

:

<4+2,56

G

<,29<

:

42

K

<>;P

Q

,59<

*

=

!

"\

+

&859P4*@

G

<

$

HE

!

R54A54@V,*A<4+*;

Q

!5;5W4*A5>

Q

\5P&

*

.%$/-%)-.)

+

&?;;

:

!

!!

@5;5

:

4*A5>

Q

65P&24

G!:

42

K

<>;+

!:G:!

$%.$-$&

:

@7

*

)

+

M<*;T,<4! 1

$

]43>< ` 1&]*

G

@5;5

:

4*A5>

Q

N24O+?2

:

!

E@A5,>*,

G

;?<+;5;<27;?<54;*,;<>?,262

GQ

5,@

:

45>;*><

*

=

+

&

*

.%$)-%/-%/

+

&?;;

:

!

!!

N<P&9*;&<@3

!

P*

G

@5;5-

:

4*A

!

*,@<F&

?;96

*

(

+

R26@4<,1W

$

\5,@<4`[&]*

G

@5;5

:

4*A5>

Q

!

E;<>?,262

G

*>56

:

<4+

:

<>;*A<

*

=

!

"\

+

&

*

.%$)-%(-%$

+

& ?;;

:

!

!!

NNN&

N?*;<?23+<&

G

2A

!

+*;<+

!

@<7536;

!

7*6<+

!

9*>42+*;<+

!

2+;

:!

W8E[S

!

:

>5+;

0

P*

G

0

@5;5

0

5,@

0

:

4*A5>

Q

0

-

0

95

Q

0

.%$)&

:

@7

*

C

+

8?*,5E>5@<9

Q

27S<6<>2993,*>5;*2,=<+<54>?27H##S&]*

G

@5;5N?*;<

:

5

:

<4

*

=

!

"\

+

&

*

.%$)-%'

+

&8?*,5 E>5@<9

Q

27

S<6<>2993,*>5;*2,=<+<54>?27H##S

"

*,8?*,<+<

#

"

O^³ D E ½ ? � D $ % F

&

C S T Ú ê ë

*

=

!

"\

+

&

*

.%$)-%'

+

&

O^³DE½?�D$%F

$

.%$)

#

*

'

+

!2,

G

I

$

\534<] `

$

[4*A5+;5A5!&S43;?@*+>2A<4

Q

5,@

>2

:Q

*,

G

@<;<>;*2,*,5@

Q

,59*>N246@

*

1

+

&W42><<@*,

G

+27;?<

e\!] ,̀@2N9<,;

$

.%%0

$

.

"

$

#!

(C.('/

*

D

+

W2@<+;51

$

W4*;TO<4W

$

H2,*T`1

$

<;56&]*

G

@5;5

!

+<*T*,

G

2

::

24;3,*;*<+

:

4<+<4A*,

G

A563<+

*

=

!

"\

+

& M5+?*,

G

;2,

!

F̀<>3;*A< "77*>< 27 ;?< W4<+*@<,;

$

S?< M?*;< R23+<

M5+?*,

G

;2,&

*

.%$)-%(-%$

+

&?;;

:

!

!!

NNN&N?*;<?23+<&

G

2A

!

+*;<+

!

@<7536;

!

7*6<+

!

@2>+

!

P*

G

0

@5;5

0

:

4*A5>

Q

0

4<

:

24;

0

95

Q

0

$

0

.%$)&

:

@7

*

0

+

U<,

G

!

$

J?5,

G

H

$

\*R&]*

G

@5;5+<>34*;

Q

5,@

:

4*A5>

Q

:

42;<>;*2,

*

1

+

&8?*,<+<1234,5627829

:

3;<4+

$

.%$)

$

/'

"

$

#!

.)C.(D

"

QR)

$

$

TU

&

CST¬�&vw��

*

1

+

&

!"#

.�

$

.%$)

$

/'

"

$

#!

.)C.(D

#

*

$%

+

H<,

G

I*527<,

G

$

8*I*5,

G

&]*

G

@5;595,5

G

<9<,;

!

82,><

:

;+

$

;<>?,*

a

3<+5,@>?566<,

G

<+

*

1

+

&1234,5627829

:

3;<4=<+<54>?

5,@!<A<62

:

9<,;

$

.%$/

$

(%

"

$

#!

$)C$C0

"

*,8?*,<+<

#

"

³Ç´

$

VW

&

CSTmß

!

ªª

)

78&£¤

*

1

+

&

!"#

$%&'(

$

.%$/

$

(%

"

$

#!

$)C$C0

#

*

$$

+

M2,

G

= 8 M

$

U3 E

$

M5,

G

d

$

<;56&85,;?<3;*6*;

Q

27

5,2,

Q

9*T<@@5;5P<3+<@724

:

4*A5>

Q

P4<5>?<+

*

1

+

&E8H

S45,+2,d,2N6<@

G

<!*+>2A<4

Q

7429!5;5

$

.%$$

$

(

"

/

#!

$$C

*

$.

+

Y545

Q

5,5, E

$

[?95;*O2A e&=23+;@<-5,2,

Q

9*T5;*2, 27

654

G

<+

:

54<@5;5+<;+

*

8

+

!!

W42>27;?<.0;?#̀ `̀ [

Q

9

:

2,

[<>34*;

Q

5,@W4*A5>

Q

"

[LW.%%D

#

&Y<Nf24O

!

#̀ `̀

$

.%%D

!

$$$$.(

*

$/

+

E6*,5 `

$

[3,

GK

*,#9

$

H2+<6<

Q

]&U5+;>63+;<4*,

G

3+*,

G

H5

:

=<@3><

*

8

+

!!

W42>27;?<$';?E8H[#Zd!!#,;82,7

2,d,2N6<@

G

<!*+>2A<4

Q

5,@!5;5H*,*,

G

"

d!!.%$$

#

&Y<N

f24O

!

E8H

$

.%$$

!

CD$CD0

*

$)

+

85<;5,2S1

$

S45*,5E1H

$

\g

:

<T1

$

<;56&863+;<4*,

G

A<4

Q

654

G

<936;*-@*9<,+*2,56@5;5+<;+N*;?H5

:

=<@3><

*

8

+

!!

W42>

27;?<$';?E8H[#Zd!!#,;82,72,d,2N6<@

G

<!*+>2A<4

Q

5,@!5;5 H*,*,

G

"

d!!.%$$

#

&Y<N f24O

!

E8H

$

.%$$

!

C0%C0D

*

$(

+

U65A*28?*<4*>?<;;*

$

Y*6<+?!56A*

$

=5A*d3954&8244<65;*2,

863+;<4*,

G

*, H5

:

=<@3><

*

8

+

!!

W42> 27;?<.%;? E8H

[#Zd!!#,;82,72,d,2N6<@

G

<!*+>2A<4

Q

5,@!5;5H*,*,

G

"

d!!.%$)

#

&Y<Nf24O

!

E8H

$

.%$)

!

C)$C(%

*

$C

+

R+*<?81

$

8?5,

G

d M

$

\*,81

$

<;56&E@356>224@*,5;<

@<+><,;9<;?2@724654

G

<-+>56<6*,<54[eH

*

8

+

!!

W42>27;?<

.(;?#,;82,72, H5>?*,<\<54,*,

G

"

#8H\.%%D

#

&H<,62

W54O

$

8E

!

EEE#

$

.%%D

!

)%D)$(

*

$'

+

[>?9*@;H

$

=23FY\

$

]5>?U&82,A<4

G

<,><45;<+27*,<F5>;

:

42F*956-

G

45@*<,;9<;?2@+724>2,A<F2

:

;*9*T5;*2,

*

8

+

!!

W42>27;?< .(;? E,,356 82,7 2, Y<3456#,72495;*2,

W42><++*,

G

[

Q

+;<9+

"

Y#W[.%$$

#

&]<46*,

!

[

:

4*,

G

<4

$

.%$$

!

$)(D$)CC

*

$D

+

EPP<` E

$

d?5,@5,*E `

$

\2 E M&W4*A5>

Q

-

:

4<+<4A*,

G

9<;?2@+724+?54*,

G

7*,5,>*564*+O<F

:

2+34<+

*

1

+

&E9<4*>5,

>̀2,29*>=<A*<N

!

W5

:

<4+ L W42><<@*,

G

+

$

.%$.

$

$%.

"

/

#!

C('%

*

$0

+

"77*>< 27 ;?< W4*A5>

Q

8299*++*2,<4& W4*A5>

Q

*9

:

5>;

5++<++9<,;

G

3*@<&E3+;456*5,Z2A<4,9<,;

*

=

!

"\

+

&

*

.%%D-

%'-$C

+

&?;;

:

!

!!

NNN&

:

4*A5>

Q

&24

G

&,T

!

,<N+-5,@-

:

3P6*>5;*2,+

!

G

3*@5,><-,2;<+

!:

4*A5>

Q

-*9

:

5>;-5++<++9<,;-?5,@P22O

*

.%

+

H<;?2@262

GQ

724 W4*A5>

Q

=*+O H5,5

G

<9<,;

!

R2N ;2

#9

:

6<9<,;;?<!5;5W42;<>;*2,E>;

*

=

!

"\

+

&

*

.%$.-%(-%0

+

&

?;;

:

!

!!

NNN&

:

*5N5;>?&<3

!

,2@<

!

$(/0

*

.$

+

86*7;2,8

$

d5,;54>*2

G

623H

$

\*,I

$

<;56&S226+724

:

4*A5>

Q

:

4<+<4A*,

G

@*+;4*P3;<@ @5;5 9*,*,

G

*

1

+

& E8H [#Zd!!

:

6245;*2,+

$

.%%.

$

)

"

.

#!

.D/)

*

..

+

\*3d

$

S<4T*`&E7459<N24O724>29

:

3;*,

G:

4*A5>

Q

+>24<+

273+<4+*,2,6*,<+2>*56,<;N24O+

*

8

+

!!

W42>27;?<0;?#̀ `̀

#,;82,72,!5;5 H*,*,

G

"

#8!H .%%0

#

&W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

.%%0

!

./(.).

*

./

+

H*+62A<E

$

e*+N5,5;?]

$

Z3995@*d

$

<;56&f2354<N?2

Q

23O,2N

!

#,7<44*,

G

3+<4

:

427*6<+*,2,6*,<+2>*56,<;N24O+

*

8

+

!!

W42>27;?</4@#,;82,72,M<P[<54>?5,@M<P!5;5

H*,*,

G

"

M[!H.%$%

#

&Y<Nf24O

!

E8H

$

.%$%

!

.)/.(.

Page 16: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

*

.)

+

U<*

G

<,P5391

$

15

GG

54@E!

$

M4*

G

?;=E&S2N54@+5724956

92@<6275>>23,;5P*6*;

Q

*

8

+

!!

W42>27;?<$0;?M24O+?2

:

2,

Y<N [<>34*;

Q

W545@*

G

9+ M24O+?2

:

"

Y[WM .%$$

#

&Y<N

f24O

!

E8H

$

.%$$

!

)((C

*

.(

+

M<*;T,<4!1&#,72495;*2,5>>23,;5P*6*;

Q

*

1

+

&82993,*>5;*2,

27;?<E8H

$

.%%D

$

($

"

C

#!

D.D'

*

.C

+

M5,

G

d

$

U3,

G

]8 H

$

f3W[&R5,@*>5

::

*,

G

5;;5>O<4h+

>2,7*@<,><

!

E, 56;<4,5;*A< ;2 A-5,2,

Q

9*T5;*2,

*

1

+

&

d,2N6<@

G

<5,@#,72495;*2,[

Q

+;<9+

$

.%%'

$

$$

"

/

#!

/)(/CD

*

.'

+

U3,

G

]8H

$

M5,

G

d

$

f3W[&E,2,

Q

9*T*,

G

>65++*7*>5;*2,

@5;5724

:

4*A5>

Q:

4<+<4A5;*2,

*

1

+

&#̀ `̀ S45,+2,d,2N6<@

G

<

5,@!5;5 ,̀

G

*,<<4*,

G

$

.%%'

$

$0

"

(

#!

'$$'.(

*

.D

+

I*52 I

$

S52 f&E,5;29

Q

!

[*9

:

6<5,@<77<>;*A<

:

4*A5>

Q

:

4<+<4A5;*2,

*

8

+

!!

W42>27;?</.,@#,;82,72,e<4

Q

\54

G

<

!5;5]5+<+

"

e\!].%%C

#

&Y<N f24O

!

E8H

$

.%%C

!

$/0

$(%

*

.0

+

\*S

$

\*Y

$

J?5,

G

1

$

<;56&[6*>*,

G

!

E,<N5

::

425>?724

:

4*A5>

Q:

4<+<4A*,

G

@5;5

:

3P6*+?*,

G

*

1

+

&#̀ `̀ S45,+ 2,

d,2N6<@

G

<5,@!5;5 ,̀

G

*,<<4*,

G

$

.%$.

$

.)

"

/

#!

(C$(')

*

/%

+

S<442A*;*+ H

$

\*5

G

234*+1

$

H59236*+ Y

$

<;56&W4*A5>

Q

:

4<+<4A5;*2,P

Q

@*+5++2>*5;*2,

*

1

+

&W42><<@*,

G

+27;?<e\!]

,̀@2N9<,;

$

.%$.

$

(

"

$%

#!

0))0((

*

/$

+

H5>?5,5A5

KK

?565E

$

d*7<4!

$

Z<?4O<1

$

<;56&6-@*A<4+*;

Q

!

W4*A5>

Q

P<

Q

2,@O-5,2,

Q

9*;

Q

*

1

+

&E8HS45,+2,d,2N6<@

G

<

!*+>2A<4

Q

7429!5;5

$

.%%'

$

$

"

$

#!

$)'

*

/.

+

\*Y

$

\*S

$

e<,O5;5+3P4595,*5, [&862+<,<++

!

E ,<N

:

4*A5>

Q

9<5+34<724@5;5

:

3P6*+?*,

G

*

1

+

&#̀ `̀ S45,+2,

d,2N6<@

G

<5,@!5;5 ,̀

G

*,<<4*,

G

$

.%$%

$

..

"

'

#!

0)/0(C

*

//

+

I*52I

$

S52f&9-*,A54*5,><

!

S2N54@+

:

4*A5>

Q:

4<+<4A*,

G

4<

:

3P6*>5;*2,27@

Q

,59*>@5;5+<;+

*

8

+

!!

W42>27;?<.';?

E8H#,;82,72, H5,5

G

<9<,;27!5;5

"

[#ZH"!.%%'

#

&

Y<Nf24O

!

E8H

$

.%%'

!

CD0'%%

*

/)

+

]3f

$

E@5M8U

$

M2,

G

=8M

$

<;56&W4*A5>

Q:

4<+<4A*,

G

+<4*56@5;5

:

3P6*+?*,

G

P

Q

426<>29

:

2+*;*2,

*

1

+

&W42><<@*,

G

+27

;?<e\!] ,̀@2N9<,;

$

.%%D

$

$

"

$

#!

D)(D(C

*

/(

+

]5>O+;429\

$

!N24O8

$

d6<*,P<4

G

1&M?<4<724<54;;?23

=/('0I

.

5,2,

Q

9*T<@+2>*56,<;N24O+

$

?*@@<,

:

5;;<4,+

$

5,@

+;43>;3456;<

G

5,2

G

45

:

?

Q

*

8

+

!!

W42>27;?<$C;?#,; M246@

M*@<M<P82,7

"

MMM .%%'

#

&Y<N f24O

!

E8H

$

.%%'

!

$..$/.

*

/C

+

82492@<Z

$

[4*A5+;5A5 !

$

]?5

G

5;[

$

<;56&865++-P5+<@

G

45

:

?5,2,

Q

9*T5;*2,724+2>*56,<;N24O@5;5

*

1

+

&W42><<@*,

G

+

27;?<e\!] ,̀@2N9<,;

$

.%%0

$

.

"

$

#!

D$%D$$

*

/'

+

J?<6<A5`

$

Z<;224\&W4<+<4A*,

G

;?<W4*A5>

Q

27[<,+*;*A<

=<65;*2,+?*

:

+*, Z45

:

? !5;5

*

8

+

!!

W42>27;?<$+; d!!

M24O+?2

:

2,W4*A5>

Q

$

[<>34*;

Q

$

5,@S43+;*,d!!

"

W*,d!!

.%%'

#

&]<46*,

!

[

:

*,

G

<4

$

.%%'

!

(/$'$

*

/D

+

82492@< Z

$

[4*A5+;5A5 !

$

f3 S

$

<;56&E,2,

Q

9*T*,

G

P*

:

54;*;<

G

45

:

?@5;53+*,

G

+57<

G

423

:

*,

G

+

*

1

+

&W42><<@*,

G

+27

;?<e\!] ,̀@2N9<,;

$

.%%D

$

$

"

$

#!

D//D))

*

/0

+

J23\

$

8?<,\

$

"T+3H SE&A-53;2924

:

?*+9

!

E

G

<,<456

7459<N24O724

:

4*A5>

Q:

4<+<4A*,

G

,<;N24O

:

3P6*>5;*2,

*

1

+

&

W42><<@*,

G

+27;?<e\!] ,̀@2N9<,;

$

.%%0

$

.

"

$

#!

0)C0('

*

)%

+

8?<,

G

1

$

U3 E 8 M

$

\*3 1&A-*+2924

:

?*+9

!

W4*A5>

Q

:

4<+<4A*,

G

,<;N24O

:

3P6*>5;*2,5

G

5*,+;+;43>;34565;;5>O+

*

8

+

!!

W42>27;?</%;?E8H#,;82,72, H5,5

G

<9<,;27!5;5

"

[#ZH"!.%$%

#

&Y<Nf24O

!

E8H

$

.%$%

!

)(0)'%

*

)$

+

M3M

$

I*52f

$

M5,

G

M

$

<;56&A-+

Q

99<;4

Q

92@<6724

*@<,;*;

Q

5,2,

Q

9*T5;*2,*,+2>*56,<;N24O+

*

8

+

!!

W42>27;?<

$/;?#,;82,72, F̀;<,@*,

G

!5;5P5+<S<>?,262

GQ

"

!̀]S

.%$%

#

&Y<Nf24O

!

E8H

$

.%$%

!

$$$$..

*

).

+

\*3d

$

S<4T*S&S2N54@+*@<,;*;

Q

5,2

Q

9*T5;*2,2,

G

45

:

?+

*

8

+

!!

W42>27;?<.D;?E8H#,;82,72,H5,5

G

<9<,;27!5;5

"

[#ZH"!.%%D

#

&Y<Nf24O

!

E8H

$

.%%D

!

0/$%C

*

)/

+

f*,

G

I

$

M3I&=5,@29*T*,

G

+2>*56,<;N24O+

!

E+

:

<>;439

:

4<+<4A*,

G

5

::

425>?

*

8

+

!!

W42>27;?<D;?[#EH 82,72,

!5;5H*,*,

G

"

[!H.%%D

#

&W?*65@<6

:

?*5

$

WE

!

[#EH

$

.%%D

!

'/0'(%

*

))

+

J?23]

$

W<*1&EP4*<7+34A<

Q

2,5,2,

Q

9*T5;*2,;<>?,*

a

3<+

724

:

4*A5>

Q:

4<+<4A*,

G:

3P6*+?*,

G

27+2>*56,<;N24O@5;5

*

8

+

!!

W42>27;?<$);? E8H [#Zd!!#,;82,72, d,2N6<@

G

<

!*+>2A<4

Q

5,@!5;5H*,*,

G

"

d!!.%%D

#

&Y<Nf24O

!

E8H

$

.%%D

!

$...

*

)(

+

[;<?6i!

$

[;<*,7<6@=&U5+;<47366

Q

?292924

:

?*><,>4

Q:

;*2,

*

8

+

!!

W42> 27;?< $C;? #,; 82,7 2, ;?< S?<24

Q

5,@

E

::

6*>5;*2, 27 84

Q:

;262

GQ

5,@ #,72495;*2, [<>34*;

Q

"

E[#E8=fWS.%$%

#

&]<46*,

!

[

:

4*,

G

<4

$

.%$%

!

/''/0)

*

)C

+

12+<

:

! U&E

:

42A5P6

Q

+<>34<5@@*;*A<5,@ 936;*

:

6*>5;*A<

:

4*A5>

Q

?292924

:

?*+9

*

8

+

!!

W42>27;?<(;?#,;82,72,

#,72495;*2,[<>34*;

Q

"

#[8.%%.

#

&]<46*,

!

[

:

4*,

G

<4

$

.%%.

!

)'$)D/

*

)'

+

Z<,;4

Q

8&U366

Q

?292924

:

?*><,>4

Q:

;*2,3+*,

G

*@<5665;;*><+

*

8

+

!!

W42>27;?<$;?E8H[

Q

9

:

2,S?<24

Q

27829

:

3;*,

G

&

Y<Nf24O

!

E8H

$

.%%0

!

$C0$'D

*

)D

+

R3R

$

I31

$

I3I

$

<;56&W4*A5;<+<54>?2,O<

Q

-A563<+;24<+

N*;??*<454>?*>56*,@<F<+

*

8

+

!!

W42>27;?</%;?#̀ `̀ #,;

82,72,!5;5 ,̀

G

*,<<4*,

G

"

#8!̀ .%$)

#

&W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

.%$)

!

C.DC/0

*

)0

+

R3R

$

I31

$

=<,8

$

<;56&W42><++*,

G:

4*A5;<

a

3<4*<+2A<4

3,;43+;<@@5;5>623@;?423

G

?

:

4*A5>

Q

?292924

:

?*+9

*

8

+

!!

W42>27;?<.';?#̀ `̀ #,;82,72,!5;5 ,̀

G

*,<<4*,

G

"

#8!̀

.%$$

#

&W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

.%$$

!

C/0C))

*

(%

+

Z26@4<*>?"&S?<723,@5;*2,+27>4

Q:

;2

G

45

:

?

Q

1

e2639<.

*

H

+

&859P4*@

G

<

$

Vd

!

859P4*@

G

<V,*A<4+*;

Q

W4<++

$

.%%)

*

($

+

e5*@

Q

51

$

86*7;2, 8&W4*A5>

Q :

4<+<4A*,

G

5++2>*5;*2,436<

9*,*,

G

*,A<4;*>566

Q:

54;*;*2,<@@5;5

*

8

+

!!

W42>27;?<D;?

E8H [#Zd!!#,;82,72,d,2N6<@

G

<!*+>2A<4

Q

5,@!5;5

H*,*,

G

"

d!!.%%.

#

&Y<Nf24O

!

E8H

$

.%%.

!

C/0C))

*

(.

+

[?<*O? =

$

H*+?45 ! d

$

d3954 ]&[<>34< 936;*

:

54;

Q

>29

:

3;5;*2,

!

U429 9*66*2,5*4<+

:

42P6<9;25,2,

Q

9*T<4

*

1

+

&

#,72495;*2,[<>34*;

Q

1234,56

!

E Z62P56W<4+

:

<>;*A<

$

.%$$

$

.%

"

$

#!

.(//

*

(/

+

d59545[

$

W5

:

595,;?238

$

=2<@<4S&!

Q

,59*>[<54>?5P6<

[

Q

99<;4*> ,̀>4

Q:

;*2,

*

8

+

!!

W42>27;?<$0;?E8H 82,72,

829

:

3;<45,@82993,*>5;*2,+[<>34*;

Q

"

88[.%$.

#

&Y<N

f24O

!

E8H

$

.%$.

!

0C(0'C

)$

!"#$%&'(

!

.%$(

$

(.

"

.

#

Page 17: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

*

()

+

EP@5665H

$

8?<A5++3;"

$

U23

a

3<W E

$

<;56&[<54>?5P6<

<,>4

Q:

;*2, 4<A*+*;<@

!

82,+*+;<,>

Q :

42

:

<4;*<+

$

4<65;*2, ;2

5,2,

Q

923+#]̀

$

5,@<F;<,+*2,+

*

8

+

!!

W42>27;?<.(;?

E,,356#,; 84

Q:

;262

GQ

82,7

"

8=fWS" .%%(

#

&]<46*,

!

[

:

4*,

G

<4

$

.%%(

!

.%(...

*

((

+

R

Q

3,[=

$

M*66

Q

[

$

d*9 R1&[<>34<+<54>?5P6<

:

3P6*>O<

Q

<,>4

Q:

;*2,+>?<9<5

G

5*,+;O<

Q

N24@

G

3<++*,

G

5;;5>O+

*

1

+

&

#̀#8̀ 6̀<>;42,*> F̀

:

4<++

$

.%%0

$

C

"

(

#!

./'.)/

*

(C

+

!3M

$

J?5,J&]3*6@*,

G

@<>*+*2,;4<<>65++*7*<42,

:

4*A5;<

@5;5

*

8

+

!!

W42>27;?<#̀ `̀ #,;82,72,W4*A5>

Q

$

[<>34*;

Q

5,@!5;5H*,*,

G

&W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

.%%.

!

$.$$.D

*

('

+

e5*@

Q

51

$

86*7;2,8&W4*A5>

Q

-

:

4<+<4A*,

G

A-9<5,+>63+;<4*,

G

2A<4A<4;*>566

Q:

54;*;*2,<@@5;5

*

8

+

!!

W42>27;?<0;?E8H

[#Zd!!#,;82,72,d,2N6<@

G

<!*+>2A<4

Q

5,@!5;5H*,*,

G

"

d!!.%%/

#

&Y<Nf24O

!

E8H

$

.%%/

!

.%C.$(

*

(D

+

!N24O8&!*77<4<,;*56W4*A5>

Q

*

8

+

!!

W42>27;?<//4@#,;

82662

a

3*39 2, E3;295;5

$

\5,

G

35

G

<+ 5,@ W42

G

4599*,

G

"

#8E\W.%%C

#

&]<46*,

!

[

:

4*,

G

<4

$

.%%C

!

$$.

*

(0

+

!N24O8&!*77<4<,;*56

:

4*A5>

Q

!

E+34A<

Q

274<+36;+

*

8

+

!!

W42>27;?<(;?#,;82,72, S?<24

Q

5,@ E

::

6*>5;*2,+27

H2@<6+27829

:

3;5;*2,

"

SEH8.%%D

#

&]<46*,

!

[

:

4*,

G

<4

$

.%%D

!

$$0

*

C%

+

!N24O8

$

\<*1&!*77<4<,;*56

:

4*A5>

Q

5,@42P3+;+;5;*+;*>+

*

8

+

!!

W42>27;?< )$+; E,,356 E8H [

Q

9

:

2, S?<24

Q

27

829

:

3;*,

G

"

[S"8.%%0

#

&Y<Nf24O

!

E8H

$

.%%0

!

/'$/D%

*

C$

+

!N24O8

$

Y524H

$

=<*,

G

26@"

$

<;56&",;?<>29

:

6<F*;

Q

27

@*77<4<,;*566

Q:

4*A5;<@5;54<6<5+<

!

7̀7*>*<,;56

G

24*;?9+5,@

?54@,<++4<+36;+

*

8

+

!!

W42>27;?<)$+;E,,356E8H [

Q

9

:

2,S?<24

Q

27829

:

3;*,

G

"

[S"8.%%0

#

&Y<Nf24O

!

E8H

$

.%%0

!

/D$/0%

*

C.

+

!N24O 8& S?< @*77<4<,;*56

:

4*A5>

Q

742,;*<4

"

<F;<,@<@

5P+;45>;

#*

8

+

!!

W42>27;?<C;?S?<24

Q

2784

Q:

;2

G

45

:

?

Q

82,7

"

S88.%%0

#

&]<46*,

!

[

:

4*,

G

<4

$

.%%0

!

)0C(%.

*

C/

+

J?5,

G

I*52

K

*5,

$

H<,

G

I*527<,

G

&!*77<4<,;*56

:

4*A5>

Q

*,@5;5

:

3P6*>5;*2,5,@5,56

Q

+*+

*

1

+

&8?*,<+<1234,5627829

:

3;<4+

$

.%$)

$

/'

"

)

#!

0.'0)0

"

*,8?*,<+<

#

"

SXY

$

³Ç´

&

)¡ST'æ³üý`�üvw��

*

1

+

&

!"#.�

$

.%$)

$

/'

"

)

#!

0.'0)0

#

*

C)

+

!N24O8

$

H>[?<44

Q

U

$

Y*++*9d

$

<;56&856*P45;*,

G

,2*+<;2

+<,+*;*A*;

Q

*,

:

4*A5;<@5;55,56

Q

+*+

*

8

+

!!

W42>27;?</4@

S?<24

Q

27 84

Q:

;2

G

45

:

?

Q

82,7

"

S88 .%%C

#

& ]<46*,

!

[

:

4*,

G

<4

$

.%%C

!

/C//D(

*

C(

+

H>[?<44

Q

U

$

S56N54d&H<>?5,*+9@<+*

G

,A*5@*77<4<,;*56

:

4*A5>

Q

*

8

+

!!

W42>27;?<)D;? E,,356#̀ `̀ [

Q

9

:

2,

U23,@5;*2,+27829

:

3;<4[>*<,><

"

U"8[.%%'

#

&W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

.%%'

!

0)$%/

*

CC

+

I*52I

$

I*2,

G

\

$

f35,8&!*77<4<,;*56

:

4*A5>

Q

A*5N5A<6<;

;45,+7249+

*

1

+

&#̀ `̀ S45,+ 2, d,2N6<@

G

< 5,@ !5;5

G

*,<<4*,

G

$

.%$$

$

./

"

D

#!

$.%%$.$)

*

C'

+

R5

Q

H

$

=5+;2

G

*e

$

H*O653Z

$

<;56&]22+;*,

G

;?<5>>345>

Q

27@*77<4<,;*566

Q:

4*A5;<?*+;2

G

459+;?423

G

?>2,+*+;<,>

Q

*

8

+

!!

W42>27;?</C;?#,;82,72,e<4

Q

\54

G

<!5;5]5+<+

"

e\!]

.%$%

#

&Y<Nf24O

!

E8H

$

.%$%

!

$%.$$%/.

*

CD

+

I31

$

J?5,

G

J

$

I*52I

$

<;56&!*77<4<,;*56

:

4*A5;<?*+;2

G

459

:

3P6*>5;*2,

*

1

+

& #,;<4,5;*2,56 1234,56 27 e<4

Q

\54

G

<

!5;5P5+<

$

.%$/

$

..

"

C

#!

'0'D..

*

C0

+

E>+Z

$

8?<,=&!*77<4<,;*566

Q:

4*A5;<?*+;2

G

459

:

3P6*+?*,

G

;?423

G

?62++

Q

>29

:

4<++*2,

*

8

+

!!

W42>27;?<$$;?#̀ `̀ #,;

82,72,!5;5H*,*,

G

"

#8!H.%$.

#

&W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

.%$.

!

D)0(

*

'%

+

=5+;2

G

*e

$

Y5;? [&!*77<4<,;*566

Q:

4*A5;<5

GG

4<

G

5;*2,27

@*+;4*P3;<@;*9<-+<4*<+ N*;?;45,+72495;*2,5,@<,>4

Q:

;*2,

*

8

+

!!

W42>27;?</%;?E8H#,;82,72,H5,5

G

<9<,;27!5;5

"

[#ZH"!.%$%

#

&Y<Nf24O

!

E8H

$

.%$%

!

'/(')C

*

'$

+

J?5,

G

I

$

8?<,=

$

I31

$

<;56&S2N54@+E>>345;<R*+;2

G

459

W3P6*>5;*2,3,@<4!*77<4<,;*56W4*A5>

Q

*

8

+

!!

W42>27;?<$);?

[#EH#,;82,72,!5;5H*,*,

G

"

[!H.%$)

#

&W?*65@<6

:

?*5

$

WE

!

[#EH

$

.%$)

!

(D'(0(

*

'.

+

d<6654*+Z

$

W5

:

5@2

:

2362+[&W45>;*>56@*77<4<,;*56

:

4*A5>

Q

A*5

G

423

:

*,

G

5,@ +922;?*,

G

*

1

+

&W42><<@*,

G

+ 27;?< e\!]

,̀@2N9<,;

$

.%$/

$

C

"

(

#!

/%$/$.

*

'/

+

_54@5

K

*M

$

f5,

G

M

$

\*Y&W4*e*<N

!

W45>;*>56@*77<4<,;*566

Q

:

4*A5;<4<6<5+<27954

G

*,56>2,;*,

G

<,>

Q

;5P6<+

*

8

+

!!

W42>27

;?</);?E8H#,;82,72,H5,5

G

<9<,;27!5;5

"

[#ZH"!

.%$)

#

&Y<Nf24O

!

E8H

$

.%$)

!

$)/($))C

*

')

+

82492@<Z

$

W42>2

:

*3>H

$

[4*A5+;5A5!

$

<;56&W4*AP5

Q

<+

!

W4*A5;<@5;54<6<5+<A*5P5

Q

<+*5,,<;N24O+

*

8

+

!!

W42>27;?<

/);? E8H #,;82,72, H5,5

G

<9<,;27!5;5

"

[#ZH"!

.%$)

#

&Y<Nf24O

!

E8H

$

.%$)

!

$)./$)/)

*

'(

+

8?5,SR R

$

[?*`

$

[2,

G

!&W4*A5;<5,@>2,;*,3564<6<5+<

27+;5;*+;*>+

*

1

+

&E8H S45,+2,#,72495;*2,5,@[

Q

+;<9

[<>34*;

Q

$

.%$$

$

$)

"

/

#!

$./

*

'C

+

]262;1

$

U5N5TY

$

H3;?3O4*+?,5,[

$

<;56&W4*A5;<@<>5

Q

<@

:

4<@*>5;<+39+2,+;4<59+

*

8

+

!!

W42>27;?<$C;?#,;82,72,

!5;5P5+<S?<24

Q

"

#8!S.%$/

#

&Y<N f24O

!

E8H

$

.%$/

!

.D).0(

*

''

+

U5,\

$

I*2,

G

\&E,5@5

:

;*A<5

::

425>?;24<56-;*9<5

GG

4<

G

5;<

92,*;24*,

G

N*;?@*77<4<,;*56

:

4*A5>

Q

*

1

+

&#̀ `̀ S45,+2,

d,2N6<@

G

<5,@!5;5 ,̀

G

*,<<4*,

G

$

.%$)

$

.C

"

0

#!

.%0).$%C

*

'D

+

d54N5e

$

=5+O?2@,*O2A5[

$

[9*;?E

$

<;56&W4*A5;<5,56

Q

+*+

27

G

45

:

? +;43>;34<

*

1

+

& W42><<@*,

G

+ 27 ;?< e\!]

,̀@2N9<,;

$

.%$$

$

)

"

$$

#!

$$)C$$('

*

'0

+

8?<,=

$

U3,

G

]8 H

$

f3W[

$

<;56&8244<65;<@,<;N24O

@5;5

:

3P6*>5;*2,A*5@*77<4<,;*56

:

4*A5>

Q

*

1

+

&e<4

Q

\54

G

<!5;5

]5+<+1234,56

$

.%$)

$

./

"

)

#!

C(/C'C

*

D%

+

I*52_

$

8?<,=

$

S5,d \&!*77<4<,;*566

Q:

4*A5;<,<;N24O

@5;54<6<5+<A*5+;43>;3456*,7<4<,><

*

8

+

!!

W42>27;?<.%;?

E8H [#Zd!!#,;82,72,d,2N6<@

G

<!*+>2A<4

Q

5,@!5;5

H*,*,

G

"

d!!.%$)

#

&Y<Nf24O

!

E8H

$

.%$)

!

)($)C.

*

D$

+

8?<,=

$

U3,

G

] 8 H

$

!<+5*] 8

$

<;56&!*77<4<,;*566

Q

:

4*A5;<;45,+*; @5;5

:

3P6*>5;*2,

!

E >5+< +;3@

Q

2, ;?<

H2,;4<56;45,+

:

24;5;*2,+

Q

+;<9

*

8

+

!!

W42>27;?<$D;?E8H

[#Zd!!#,;82,72,d,2N6<@

G

<!*+>2A<4

Q

5,@!5;5H*,*,

G

"

d!!.%$.

#

&Y<Nf24O

!

E8H

$

.%$.

!

.$/..$

($

³Ç´:

!

CSTvwmß

Page 18: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

*

D.

+

R*<,S

$

Z?*,*;5Z

$

[?5?5P*8&E7459<N24O724

:

42;<>;*,

G

N24O<462>5;*2,

:

4*A5>

Q

*, +

:

5;*56 >42N@+234>*,

G

*

1

+

&

W42><<@*,

G

+27;?<e\!] ,̀@2N9<,;

$

.%$)

$

'

"

$%

#!

0$0

0/%

*

D/

+

\*Y

$

_54@5

K

*M

$

[3!

$

<;56&W4*A]5+*+

!

U4<

a

3<,;*;<9+<;

9*,*,

G

N*;?@*77<4<,;*56

:

4*A5>

Q

*

1

+

&W42><<@*,

G

+27;?<

e\!] ,̀@2N9<,;

$

.%$.

$

(

"

$$

#!

$/)%$/($

*

D)

+

J<,

G

8

$

Y53

G

?;2,1U

$

85*1&",@*77<4<,;*566

Q:

4*A5;<

74<

a

3<,;*;<9+<; 9*,*,

G

*

1

+

&W42><<@*,

G

+27;?< e\!]

,̀@2N9<,;

$

.%$/

$

C

"

$

#!

.(/C

*

D(

+

[?<, `

$

f3 S& H*,*,

G

74<

a

3<,;

G

45

:

?

:

5;;<4,+ N*;?

@*77<4<,;*56

:

4*A5>

Q

*

8

+

!!

W42>27;?<$0;?E8H[#Zd!!#,;

82,72, d,2N6<@

G

< !*+>2A<4

Q

5,@ !5;5 H*,*,

G

"

d!!

.%$/

#

&Y<Nf24O

!

E8H

$

.%$/

!

()(((/

*

DC

+

J?5,

G

1

$

J?5,

G

J

$

I*52I

$

<;56&U3,>;*2,569<>?5,*+9

!

=<

G

4<++*2, 5,56

Q

+*+ 3,@<4 @*77<4<,;*56

:

4*A5>

Q

*

1

+

&

W42><<@*,

G

+27;?<e\!] ,̀@2N9<,;

$

.%$.

$

(

"

$$

#!

$/C)

$/'(

*

D'

+

8?53@?34*d

$

H2,;<6<2,*8

$

[54N5;<E !&!*77<4<,;*566

Q

:

4*A5;<<9

:

*4*>564*+O9*,*9*T5;*2,

*

1

+

&1234,5627H5>?*,<

\<54,*,

G

=<+<54>?

$

.%$$

$

$.

!

$%C0$$%0

*

DD

+

H2?599<@Y

$

8?<,=

$

U3,

G

]8 H

$

<;56&!*77<4<,;*566

Q

:

4*A5;<@5;54<6<5+<724@5;59*,*,

G

*

8

+

!!

W42>27;?<$';?

E8H[#Zd!!#,;82,72,d,2N6<@

G

<!*+>2A<4

Q

5,@!5;5

H*,*,

G

"

d!!.%$$

#

&Y<Nf24O

!

E8H

$

.%$$

!

)0/(%$

*

D0

+

[9*;? E&W4*A5>

Q

-

:

4<+<4A*,

G

+;5;*+;*>56<+;*95;*2, N*;?

2

:

;*956>2,A<4

G

<,><45;<

*

8

+

!!

W42>27;?<)/4@ E,,356

E8H[

Q

9

:

2,S?<24

Q

27829

:

3;*,

G

"

[S"8.%$$

#

&Y<N

f24O

!

E8H

$

.%$$

!

D$/D..

*

0%

+

82492@< Z

$

W42>2

:

*3> 8 H

$

[4*A5+;5A5 !

$

<; 56&

!*77<4<,;*566

Q:

4*A5;<+

:

5;*56@<>29

:

2+*;*2,+

*

8

+

!!

W42>27

;?<.D;?#̀ `̀ #,;82,72,!5;5 ,̀

G

*,<<4*,

G

"

#8!̀ .%$.

#

&

W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

.%$.

!

.%/$

*

0$

+

\*8

$

R5

Q

H

$

=5+;2

G

*e

$

<;56&"

:

;*9*T*,

G

6*,<54>23,;*,

G

a

3<4*<+3,@<4@*77<4<,;*56

:

4*A5>

Q

*

8

+

!!

W42>27;?<)$+;

E,,356E8H[

Q

9

:

2,S?<24

Q

27829

:

3;*,

G

"

W"![.%$%

#

&

Y<Nf24O

!

E8H

$

.%$%

!

$./$/)

*

0.

+

\*8

$

R5

Q

H

$

Z<429< H&!5;55,@ N24O625@5N54<

56

G

24*;?972445,

G

<

a

3<4*<+3,@<4@*77<4<,;*56

:

4*A5>

Q

*

1

+

&

W42><<@*,

G

+27;?<e\!] ,̀@2N9<,;

$

.%$)

$

'

"

(

#!

/)$

/(.

*

0/

+

f35, Z

$

J?5,

G

J

$

M*,+6<;; H

$

<; 56& \2N-45,O

9<>?5,*+9

!

"

:

;*9*T*,

G

P5;>?

a

3<4*<+ 3,@<4 @*77<4<,;*56

:

4*A5>

Q

*

1

+

&W42><<@*,

G

+27;?<e\!] ,̀@2N9<,;

$

.%$.

$

(

"

$$

#!

$/(.$/C/

*

0)

+

M<*;T,<4 !

$

H5@@<, [

$

]43>< `&]*

G

@5;5

:

4*A5>

Q

!

:

624*,

G

;?<73;34<426<27;<>?,262

GQ

*,

:

42;<>;*,

G:

4*A5>

Q

*

=

!

"\

+

&

*

.%$/-%C-$0

+

&?;;

:

!

!!

P*

G

@5;5&>+5*6&9*;&<@3

!

,2@<

!

00

*

0(

+

8?24 ]

$

Z26@4<*>? "

$

d3+?*6<A*;T `

$

<; 56&W4*A5;<

*,72495;*2,4<;4*<A56

*

1

+

&1234,5627;?<E8H

$

$00D

$

)(

"

C

#!

0C(0D$

*

0C

+

d3+?*6<A*;T`

$

"+;42A+O

Q

=&=<

:

6*>5;*2,*+,2;,<<@<@

!

[*,

G

6< @5;5P5+<

$

>29

:

3;5;*2,566

Q

-

:

4*A5;< *,72495;*2,

4<;4*<A56

*

8

+

!!

W42>27;?</(;? E,,356#̀ `̀ [

Q

9

:

2,

U23,@5;*2,+ 27 829

:

3;<4 [>*<,><

"

U"8[ $00'

#

&

W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

$00'

!

/C)/'/

*

0'

+

Z26@4<*>?"

$

Z26@N5++<4[

$

H*>56*[&R2N;2>2,+;43>;

45,@2973,>;*2,+

*

1

+

&1234,5627;?<E8H

$

$0DC

$

//

"

)

#!

'0.D%'

*

0D

+

M5,

G

\

$

H<,

G

I&\2>5;*2,

:

4*A5>

Q:

4<+<4A5;*2,*,P*

G

@5;5

<45

!

E+34A<

Q

*

1

+

&1234,5627[27;N54<

$

.%$)

$

.(

"

)

#!

C0/

'$.

"

*,8?*,<+<

#

"

Z[

$

³Ç´

&

ÀÁCSTvw��$%rì

*

1

+

&

%Ï.

$

.%$)

$

.(

"

)

#!

C0/'$.

#

*

00

+

8?5,

G

f&[*,

G

6<-@5;5P5+<

:

4*A5;<*,72495;*2,4<;4*<A56N*;?

62

G

54*;?9*> >2993,*>5;*2,

*

8

+

!!

W42> 27 ;?< 0;?

E3+;4565+*5, 82,72, #,72495;*2, [<>34*;

Q

5,@ W4*A5>

Q

"

E8#[W.%%)

#

&]<46*,

!

[

:

4*,

G

<4

$

.%%)

!

(%C$

*

$%%

+

W5*66*<4W&W3P6*>-O<

Q

>4

Q:

;2+

Q

+;<9+P5+<@2,>29

:

2+*;<

@<

G

4<<4<+*@32+*;

Q

>65++<+

*

8

+

!!

W42>27;?<$';?#,;82,72,

S?<24

Q

5,@ E

::

6*>5;*2, 27 84

Q:

;2

G

45

:

?*> S<>?,*

a

3<+

"

3̀42>4

Q:

;$000

#

&]<46*,

!

[

:

4*,

G

<4

$

$000

!

.././D

*

$%$

+

[*2, =

$

854P3,54 ]& ", ;?<

:

45>;*>56*;

Q

27

:

4*A5;<

*,72495;*2,4<;4*<A56

*

8

+

!!

W42>27;?<$/;?Y<;N24O5,@

!*+;4*P3;<@[

Q

+;<9+[<>34*;

Q

[

Q

9

:

"

Y![[.%%'

#

&=<+;2,

$

e*4

G

*,*5

!

S?<#,;<4,<;[2>*<;

Q

$

.%%'

!

$D

*

$%.

+

M*66*59+W

$

[*2,=&V+5P6<

:

4*A5;<*,72495;*2,4<;4*<A56

*

8

+

!!

W42>27;?<$);? Y<;N24O5,@!*+;4*P3;<@[

Q

+;<9+

[<>34*;

Q

[

Q

9

:

2+*39

"

Y![[.%%D

#

&=<+;2,

$

e*4

G

*,*5

!

S?<

#,;<4,<;[2>*<;

Q

$

.%%D

!

$.$0

*

$%/

+

Z26@4<*>? "

$

"+;42A+O

Q

=& [27;N54<

:

42;<>;*2, 5,@

+*9365;*2,2,2P6*A*23+459

*

1

+

&1234,5627;?< E8H

$

$00C

$

)(

"

/

#!

)/$)'/

*

$%)

+

83*f

$

M*@291

$

15,<;\&M*<,<4

!

S45>*,

G

;?<6*,<5

G

<27

A*<N@5;5*,5N54<?23+*,

G

<,A*42,9<,;

*

1

+

&E8H S45,+

2,!5;5P5+<[

Q

+;<9

$

.%%%

$

.(

"

.

#!

$'0..'

*

$%(

+

83* f

$

M*@29 1& \*,<5

G

< ;45>*,

G

724

G

<,<456 @5;5

N54<?23+<;45,+72495;*2,+

*

1

+

&e\!]1

$

.%%/

$

$.

"

$

#!

)$

(D

*

$%C

+

[3<,8R

$

d2=d\

$

S5,f[

$

<;56&[.\2

GG

<4

!

,̀@-;2-

<,@@5;5;45>O*,

G

9<>?5,*+9724>623@@5;5

:

42A<,5,><

*

8

+

!!

W42>27;?<$.;?#̀ `̀ #,;82,72,S43+;

$

[<>34*;

Q

5,@

W4*A5>

Q

*, 829

:

3;*,

G

5,@ 82993,*>5;*2,+

"

S43+;829

.%$/

#

&W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

.%$/

!

(0)C%.

*

$%'

+

d2= d \

$

15

G

5@

:

4595,5W

$

\<<][&U62

GG

<4

!

E7*6<-

><,;4*>62

GG

<472492,*;24*,

G

7*6<5>><++5,@;45,+7<4+N*;?

>623@>29

:

3;*,

G

<,A*42,9<,;+

*

8

+

!!

W42>27;?</4@#̀ `̀

#,;M24O+?2

:

2,[<>34*;

Q

*,<-[>*<,><5,@<-=<+<54>?

"

#[[=

.%$$

#

&W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

.%$$

!

'C(''$

*

$%D

+

J?521

$

[3,

Q

U

$

S24,*5*F 8

$

<; 56& E

:

42A<,5,><-

*,;<

G

45;*2,7459<N24O724@*+;4*P3;<@ N24O762N+*,

G

4*@

<,A*42,9<,;+

*

8

+

!!

W42>27;?<$+;M24O+?2

:

2,Z4*@5,@

V;*6*;

Q

829

:

3;*,

G

"

MZV8 .%%D

#

&Y<N f24O

!

E8H

$

.%%D

!

$0

C$

!"#$%&'(

!

.%$(

$

(.

"

.

#

Page 19: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

*

$%0

+

15>2P*1& !5;5 W42A<,5,>< *, !*+;4*P3;<@ W42

:

5

G

5;24

Y<;N24O+

*

8

+

!!

W42> 27;?< /4@ #,; W42A<,5,>< 5,@

E,,2;5;*2, M24O+?2

:

"

#WEM .%$%

#

&]<46*,

!

[

:

4*,

G

<4

$

.%$%

!

.C%.C)

*

$$%

+

843T!

$

H5;;2+2 H&W42A<,5,><+<4A*><+724@*+;4*P3;<@

N24O762N+

*

8

+

!!

W42>27;?<D;?#̀ `̀ #,;[

Q

9

:

2,863+;<4

829

:

3;*,

G

5,@;?<Z4*@&W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

.%%D

!

(.C(//

*

$$$

+

U<*

G

<,P539 1

$

15

GG

54@ E !

$

M4*

G

?;= Y&S2N54@+5

72495692@<6275>>23,;5P*6*;

Q

*

8

+

!!

W42>27;?<$);?Y<N

[<>34*;

Q

W545@*

G

9+ M24O+?2

:

&Y<N f24O

$

E8H

$

.%$$

!

)((C

*

$$.

+

d*,

G

[S

$

8?<,WH&]5>O;45>O*,

G

*,;43+*2,+

*

8

+

!!

W42>27

;?<$0;? E8H [

Q

9

:

2, "

:

<45;*,

G

[

Q

+;<9+ W4*,>*

:

6<+

"

["[W.%%/

#

&Y<Nf24O

$

E8H

$

.%%/

!

.././C

*

$$/

+

d*,

G

[ S

$

H52J H

$

\3>>?<;;*! Z

$

<;56& ,̀4*>?*,

G

#,;43+*2,E6<4;+;?423

G

?H36;*-?2+;853+56*;

Q

*

8

+

!!

W42>27

;?<$$;?Y<;N24O5,@!*+;4*P3;<@[

Q

+;<9+[<>34*;

Q

[

Q

9

:

"

Y![[.%%(

#

&=<+;2,

$

e*4

G

*,*5

!

S?<#,;<4,<;[2>*<;

Q

$

.%%(

!

/C))

*

$$)

+

E?9<@ H

$

_3<4>*5!

$

R5*6<+[&E +;5;*+;*>5695;>?*,

G

5

::

425>? ;2 @<;<>;

:

4*A5>

Q

A*265;*2, 724 ;43+;-P5+<@

>2665P245;*2,+

*

8

+

!!

W42>27;?<$+;#,;M24O+?2

:

2,S43+;

$

[<>34*;

Q

5,@W4*A5>

Q

724VP*

a

3*;23+829

:

3;*,

G

"

M2MH2H

.%%(

#

&W*+>5;5N5

Q

$

Y1

!

#̀ `̀

$

.%%(

!

(0DC%.

,.-

#

>"%5?.-

#

$

P24,*,$0C)&W427<++24

5,@W?!+3

:

<4A*+245;=<,9*,V,*A<4+*;

Q

27 8?*,5& F̀<>3;*A< @*4<>;24 27 8?*,5

829

:

3;<4U<@<45;*2,&R*+95*,4<+<54>?

*,;<4<+;+*,>63@<>623@@5;595,5

G

<9<,;

$

M<P@5;595,5

G

<9<,;

$

,5;*A<IH\@5;5P5+<+

$

5,@765+?-

P5+<@@5;5P5+<+

$

:

4*A5>

Q

-

:

4<+<4A*,

G

$

<;>&

@A%-

#

>"%5

B

"%-

$

P24, *, $0D%& W?!&

H<9P<4278?*,5 829

:

3;<4U<@<45;*2,&

R*+ 95*, 4<+<54>? *,;<4<+;+ *,>63@<

@*77<4<,;*56

:

4*A5>

Q

$

@5;5 9*,*,

G

$

5,@

G

45

:

?@5;595,5

G

<9<,;&

'$

³Ç´:

!

CSTvwmß

Page 20: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

大数据管理系统分析报告

WAMDM实验室

1 大数据管理系统概念

随着人类进入 21 世纪,尤其是互联网和移动互联网技术的发展,使得人与人之间的联

系日益密切,社会结构日趋复杂,生产力水平得到极大提升,人类创造性活力得到充分释放,

与之相应的数据规模和处理系统发生了巨大改变,从而催涌了当下众人热议的大数据局面。 从历史观的角度看,数据(D)和社会(S)形成一定的对应关系,即:D1~f(SSumerians),…,

Dbig~f(Spresent),…,Dn~f(Sfuture)。从量的关系上,D1,…,Dbig,…,Dn 可能存在大小关系,还

可形成包含关系,但它们只是与当时的社会发展状况相对应:Dbig 不可能反映代表未来的 Dn,

因为我们不知道未来会有什么新的社会结构(诸如当下社交网络一类的事物)出现,也不知

道会有什么新的生产活动(诸如电商一类的事物)产生;同样 D1 也不需要具有 Dbig 的规模,

当时人们并没有如此频繁的联系。近期,美国加州大学伯克利分校 Michael I. Jordan 教授提

出的“大数据的冬天即将到来”,如果我们能历史地认识 Dbig 的地位,没有把 Dbig 当 Dn,就

不存在“冬天”与“春天”的问题。这是历史客观发展的事实。 基于以上分析,当下大数据的产生主要源于人类社会生活网络结构的复杂化、生产活动

的数字化、科学研究的信息化相关,其意义和价值在于如何帮助人们解释复杂的社会行为和

结构,以及提高人们生产制造的能力,进而丰富人们发现自然规律的手段。本质上,大数据

具有以下三方面的内涵,即:大数据的“深度”、大数据的“广度”、以及大数据的“密度”。

所谓“深度”是指单一领域数据汇聚的规模,可以进一步理解为数据内容的“维度”。而数

据的“广度”则是指多领域数据汇聚的规模,侧重体现在数据的关联、交叉和融合等方面。

大数据的“密度”是指时空维上数据汇聚的规模,即数据积累的“厚度”以及数据产生的“速

度”等。 面对不断涌现的大数据应用,数据库乃至数据管理技术面临新的挑战。传统的数据库技

术侧重考虑数据的“深度”问题,主要解决数据的组织、存储、查询和简单分析等问题。其

后,数据管理技术在一定程度上考虑了数据的“广度”和“密度”问题,主要解决数据的集

成、流处理、图结构等问题。这里提出的大数据管理是要综合考虑数据的“广度”、“深度”、

“密度”等问题,主要解决数据的获取、抽取、集成、复杂分析、解释等技术难点。因此,

与传统数据管理技术相比,大数据管理技术难度更高,处理数据的“战线”更长。 大数据管理系统正是基于上述新的挑战,着重解决数据在“广度”、“深度”或者“密度”

等方面的问题。本报告涉及的大数据管理系统可以按照解决问题的侧重点做如下的简单分

类: 表 1 大数据管理系统分类

系统类型 代表性系统 主要解决的问题

交互式实时管理系统 Dremel、PowerDrill、Impala、BlinkDB 数据的“广度”

流数据管理系统 S4、Storm、Puma、Samza 数据的“密度”

图数据管理系统 GraphLab、Pregel 数据的“广度”和“深度”

科学大数据管理系统 SciDB、Hama 数据的“深度”

其他系统 MongoDB、CouchDB、VoltDB 数据的“广度”

Page 21: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

2 大数据管理系统处理架构

近年来,大数据管理系统的发展趋势主要有两个方向,一种是以 Hadoop 和 MapReduce为代表的批处理系统,另一种是为各种特定应用开发的流处理系统。MapReduce 是近年来

工业界和学术界广泛使用的高级集群编程模型,基于非循环的数据流模型,从稳定的物理存

储如分布式文件系统中加载记录。尽管非循环数据流是一种很强大的抽象方法,但有些应用

仍然无法使用这种方式描述,例如,机器学习和图应用中常用的迭代算法以及交互式数据挖

掘中用户反复查询一个数据子集,需要将数据输出到磁盘然后在每次查询时重新加载,从而

带来较大的开销。 尽管这两种模式的处理架构能基本应对特定领域的应用需求,但随着大数据时代的到

来,单一的计算模式已难以满足整个应用的需求,因此需要考虑不同计算模式的混合使用。

Spark 作为混合式计算模式的典型代表应运而生,近年来逐渐引起了学术界和工业界的广泛

重视。 本报告的第 2 章在简单介绍批处理和流处理两种代表性系统处理架构基础上,详细介绍

了混合式计算模式的代表系统:Spark,介绍了其系统架构、特性,并提供了工业界与学术

界对其性能所做的对比分析。

3 交互式实时管理系统

数据查询是数据库等系统的核心功能,从关系数据库开始,对查询进行优化,减少查询

的响应时间就是数据库厂商和研究人员说关注的核心问题。针对关系数据库的查询优化已经

有了很多比较成熟的技术,但是随着大数据时代的到来,数据查询这一看似简单的功能又面

临着很多新的挑战。主要原因在于:1、数据量的增大使得传统的查询优化技术很难发挥功

效;2、用户对查询需求更加关注查询的响应时间。而有些查询类型根本就不可能通过传统

的方法来减少查询时间,譬如 ad-hoc 查询。 针对上述变化,目前学术界和产业界的研究点主要集中于如何在大数据的背景下,实现

交互式的实时查询系统。这种系统主要关注两个方面,一个是交互性,还有一个就是实时。

交互性体现在用户查询过程中系统的及时反馈,只有系统的及时反馈,才能确保用户根据反

馈的结果进行下一步的查询与分析。因此实现一个交互式的实时查询系统,关键问题还是如

何实现数据的实时查询,尤其是大数据环境下的实时查询。 交互式实时查询系统在很多领域都有着广泛的应用,譬如用户去网上购买商品,常常会

根据某些属性的组合来检索合适的商品,如果系统反馈的时间过长,用户很可能失去耐心,

不再购买。这类的查询在电子商务,电信,金融等诸多领域都有着非常广泛的应用。 实现交互式的实时查询系统大体上有两种思路:一种思路是在分布式的环境下通过增加

硬件资源(CPU、内存等)来减少数据查询的时间;在这种思路的指导下,Google 开发出

了 Dremel 系统,主要用于 Web 数据的分析与查询。受到 Dremel 的启发,很多企业开始研

发类似的产品,目前比较具有代表性的就是 Cloudera 公司的 Impala 系统。在 Dremel 之外,

Google 还开发了 PowerDrill 系统,该系统和 Dremel 的应用场景不同,但是都能在极短的时

间内对海量的数据进行查询和分析。另一种思路则在数据精度和查询时间的延迟上进行了权

衡,以牺牲一定的数据精度来换取查询时间上的大幅度减少。这类系统的典型代表有 UCB的 AMP 实验室开发的 BlinkDB 等。

本报告会对 Dremel,Powerdrill,Impala 和 BlinkDB 这四个系统逐一进行分析,主要针

对其系统架构、特性和性能指标等展开介绍。同时也尽可能的尝试将同类型的系统进行初步

的对比分析。

Page 22: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

4 流数据管理系统

数据流管理系统广泛地应用于实时分析处理,在线机器学习,连续计算,分布式 RPC,实时搜索,实时交易系统,实时欺骗分析,实时监控和社交网络等领域。随着社交网络、高

频股市交易、实时网络监控、传感器网络数据库的技术发展,针对于海量的、变化频繁的、

要求实时响应的流式大数据处理技术的需求也在不断增加。数据流管理系统需要具有高可靠

性和高可用性的实时数据处理的能力,面对持续到达的数据流,系统必须快速对其进行响应

并即时输出结果。 传统数据库系统(DBMS)往往是针对已在数据库中存储的静态数据集进行的一次性的 ad

hoc 查询。而数据流管理系统(DSMS)处理的数据流是一般是无限的数据集合,往往需要处理

用户提供的连续查询,并实时地返回针对当前数据流的查询结果。 数据流管理系统已有十余年的发展历程,目前,随着对流式大数据处理技术的不断创新,

工业界和学术界推出了一系列的数据流管理系统实例。本报告会对 Storm,S4,Puma 和 Samza这四个系统逐一进行分析,主要针对其系统架构、特性和性能指标等展开介绍,并尝试对同

类型的系统进行初步的对比分析。

5 图数据管理系统

大数据时代,许多实际的计算问题都涉及到图,例如 Web 图、各种社会网络等等。图的

规模日益增长给它们的处理带来了极大的挑战。图算法通常对内存访问表现出很低的局部

性,每个节点的计算过少,计算过程中并行度不断变化。分布式计算模式的引入加剧了局部

性问题,并且增加了计算过程中机器故障的概率。迄今为止还没有出现一个可扩展的、通用

的系统。

如何设计一个图数据管理系统可以克服上述问题,实现对大规模图的高效处理,成为研

究者日益关注的问题。本报告的第 5章介绍了两个图数据计算框架,一个是卡内基梅隆大学

Select 实验室开发的 GraphLab,另一个是 Google 构建的 Pregel。分别对其架构、实现、

特点、性能进行了详细分析。

6 科学大数据管理系统

科学研究的各个研究领域如生物学,天文学,物理学等在研究和仿真过程中都会产生海

量的数据。海量的科学数据无疑需要分布式存储,然而由于科学数据在结构上不同于一些普

通的数据,普通的技术和软件并不能很好的支持科学数据的存储和处理。 矩阵计算以及图计算是许多数据密集型的科学应用中常见的计算需求,大规模的数值分

析,数据挖掘,计算物理学,图形渲染等经常需要矩阵的密集计算,而图计算是机器学习,

信息检索,生物信息学,社会网络分析中的基本操作。然而这类的运算很难用 MapReduce等计算框架实现,因此选择合适的计算工具就尤为重要。本报告的第 6 章详细介绍了针对科

学大数据分析和处理的两个开源系统 SciDB 和 Hama。

7 其他系统

随着数据规模的急剧增长,不同应用需求催生了众多针对特种应用的数据库管理系统,

其中文档数据库便是一种。与传统的数据库将息被分割成离散的数据段不同,文档数据库中,

文档是处理信息的基本单位。存储在集合中的文档,被存储为键-值对的形式。键用于唯一

标识一个文档,为字符串类型,而值则可以是各中复杂的文件类型。一个文档相当于关系数

据库中的一条记录。此外,为了满足高性能数据管理需求,基于内存数据库重新设计了体系

Page 23: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

结构,抛弃了磁盘数据管理的传统方式,并且在数据缓存、快速算法、并行操作方面也进行

了相应的改进,数据处理速度比传统数据库的数据处理速度要快很多。本报告的第 7 章详细

介绍了针对文档数据类型处理的两个系统 MongoDB 和 CouchDB,此外,我们也对高性能内

存数据库系统 VoltDB 进行了介绍。

8 总结

面对当前层出不穷的大数管理系统,人们常常难以选择。主要原因在于对各种系统的架

构及系统特性等不太了解。因此本报告将对上表中的各个代表性系统进行比较全面的介绍,

希望对读者能有一定的借鉴意义。 有关本报告的完整版,请参见《大数据管理系统分析报告》。

Page 24: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

多种硬件架构下大数据管理系统性能与功耗测试

孟小峰 汪凤鸣 郭志良

1(中国人民大学信息学院北京 100872)

2(中国人民大学信息学院北京 100872)

3(中国人民大学信息学院北京 100872)

Testing of big data management systems under different hardware architectures

Meng Xiaofeng,Wang Fengming and Guo Zhiliang

1(School of Information,Renmin University of China,Beijing 100872)

2(School of Information,Renmin University of China, Beijing 100872)

3(School of Information,Renmin University of China, Beijing 100872)

Abstract With the popularity of cloud computing, more and more enterprises begin to provide users with cloud

computing services. Big data can benefit enterprises, butthe increasingdata scale force enterprises

to purchase more hardware equipment andexpand the scale of data center inorder to better services.Increasing

power consumption of data center not only cause huge daily expenses, but also affect surrounding

environment.Therefore, we need to find a system which meets the performance requirements, and canalso reduce

power consumption. In this paper, we test performance and power analysis cloud data management systemon two

different hardware architectures. The first run cloud data management system under different x86 CPU platforms,

together with SSDs to accelerate system throughput, weanalyzethe performance of different platforms, and

collectperformanceand power consumption of the running systems. The second exploitARM hardware platform to

run cloud data management system, testing the ARM architecture’s performance and power consumption on large

data analysisapplication scenarios. Experiments show that ARM-based architectures can greatly reduce the power

consumption of hardware platform, thenprovide satisfactory performance at the data analysis scenarios. In this

paper we based on different hardware platforms to testing the large data management systems, giving a detailed

performance and power consumption data, providing developers with a reference to the data basis.

Keywords Cloud Computing;Big Data;Performance;Power Consumption;Hadoop;Hbase

摘要 随着云计算技术的普及,越来越多的企业开始为用户提供云计算服务。海量数据为企业创造了价

值,但不断增加的数据规模也迫使企业采购更多的硬件设备、扩大数据中心规模来为用户提供更好的服

务。然而数据中心日益增大的耗电量不仅造成了日常庞大的费用支出,而且也严重影响了周围的环境,

因此亟需能够找到既能满足大数据管理系统性能需求,又能降低系统功耗的方法。本文针对大数据管理

系统的两种不同硬件架构做了性能与功耗分析。第一种使用 x86架构下不同 CPU 平台运行大数据管理系

统,同时使用固态硬盘加速系统的吞吐率,分析了不同平台的基础性能,并测试收集了大数据管理系统

在这些平台上的性能表现和电能消耗。第二种主要使用基于 ARM架构的硬件平台运行大数据管理系统,

针对大数据分析和海量数据存取的应用场景,测试了 ARM架构系统的性能和功耗。通过实验可以看出,

使用基于 ARM架构的硬件可以极大的降低硬件平台消耗的电能,同时在数据分析的场景下能够提供满意

的性能。本文基于不同硬件平台对大数据管理系统进行了测试,给出了详尽的性能和功耗数据,为开发

者提供了可参考的数据依据。

Page 25: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

关键词 云计算; 大数据; 性能; 功耗; Hadoop; HBase

中图法分类号TP

0 引言

数据对于企业来说有巨大的潜在价值,通过存

储和分析数据,企业不仅可以记录业务运行情况,

也可以更合理的调整和开展自身的业务,从数据中

创造价值。当前所处的时代是一个数据规模急剧膨

胀的时代,为了存储和分析这些数据,企业在数据

中心上的投入不断推高了企业的经营成本。Google

公司在最近七年向数据中心累计投入了 210 亿美元[1]

,而且每个季度的投入也呈上升的趋势,微软也已

经累计投入了 150 亿美元用于建立数据中心。其中,

电力消耗支出是非常重要的一部分。首先,上万台

服务器运转所消耗的电能是巨大的,微软和 Google

公司建设新的数据中心甚至不得不选择离发电站比

较近的地方。其次,服务器高速运转会产生大量的

热量,为了维持整个数据中心的稳定运行,需要采

购大量的冷却设备,这从另一方面增加了成本。

正式由于这个问题,低功耗的硬件平台得到了

硬件厂商和 IT 企业的广泛关注。CPU 生产商 Intel

在 2012 年第四季度发布了 Atom S1200 系列,这是

第一款面向服务器应用的 Atom 系列 CPU,它的热

功耗设计只有 7W。AMD 早在 2011 年的时候就已

经收购了主营低功耗服务器的 SeaMicro 公司,同时

它也发布了基于山猫架构的低功耗 CPU,热功耗设

计也只有 9W。服务器厂商惠普也在 2013 年初发布

了 Moonshot 服务器,它号称比传统服务器节能 89%,

并且能够节省 80%的空间。固态硬盘的普及使得其

可以替代磁盘提升数据吞吐能力,同时降低硬件平

台总的电能消耗。

目前,企业广泛采用的大数据存储和分析系统

往往需要较高的 CPU 处理能力和大量的磁盘 I/O,

现有针对这类系统的研究测试工作大部分只针对系

统的性能进行了测试和研究,并没有根据不同硬件

平台下不同数据管理系统的性能和功耗等问题进行

研究。虽然新型硬件在功耗上有巨大的优势,但是

它们是否能够满足企业需求还有待验证。本文针对

传统的服务器硬件平台,加入桌面版 x86 架构的

CPU、ARM 架构的 CPU 和固态硬盘作为对比,对

大数据存储管理系统进行性能及功耗的测试研究,

探索在保证可接受性能水平的前提下,为选择合适

的硬件平台降低硬件平台总体成本和功耗提供依据。

本论文的贡献主要包括以下几个方面:

第一,根据云计算环境下数据中心的硬件建设

需求,从性能、能耗、成本三个维度来考量硬件平

台的选择。

第二,在 x86 架构下使用服务器、桌面版、低

功耗版 CPU 搭建硬件平台,运行数据管理系统并进

行性能、功耗的实验分析和数据对比,给出可参考

的测试数据。

第三,搭建ARM的测试平台,使用固态硬盘降

低整体功耗并提升系统的吞吐能力,探索ARM架构

的CPU在云计算环境下应用的可能性。

1 相关工作

随着大数据存储和处理需求的增强,产业界和

学术界都开发出一些具有不同特点的大数据管理系

统。现有的研究工作对这些系统的性能进行了研究,

并提出了针对这些数据模型的基准测试,也有一些

工作对大数据存储处理平台做了能耗的研究。

一、针对数据管理系统的测评:文章[2]针对六

个开源的大数据存储系统进行了性能的测试,并根

据应用监控管理系统的读写特点,设计了五种针对

不同应用需求的读写比例和负载,文章提供了对这

六个存储系统详细的性能分析,并给出了性能调优

的一些经验。文章[3]对比了并行数据库与 Hadoop

在处理大规模数据分析任务时的性能,并分析了两

种系统在模式支持、编程模型和执行测量等方面的

一些异同。

二、有关功耗的相关研究:已经有了一些研究

来试图减少硬件平台的电能消耗,主要有两种方式。

第一种是通过硬件的方式,这种方式能够很简

单、有效的降低整个平台的功耗,效果更好,不需

要人为的对系统调度、控制等进行人工干预,选择

低功耗的硬件平台又能够大大降低数据中心的建设

成本。文章[17]使用混合式的硬件平台为数据中心提

供服务,同时使用低功耗的硬件平台和高性能但是

功耗较高的硬件平台,并根据应用场景的不同设计

了五种不同负载的实验。从测试结果可以看出,针

Page 26: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

对于某些应用类型,低功耗平台虽然性能相比高性

能硬件有差距,但是在功耗性能比上却有明显的优

势。文章[4]使用了低功耗的嵌入式结点,并配有闪

存作为存储组成数据存储管理集群,并根据硬件特

点设计了基于日志结构的 FAWN-KV 的存储系统,

利用闪存高速读写的特点,将整个系统每焦耳能达

到性能提升到一个可接受的范围。文章[5]使用低功

耗计算结点组成一个计算集群,同时使用固态硬盘

提升集群的数据吞吐能力。与传统的服务器平台相

比,低功耗集群在消耗相同电能的条件下能够提供

更高的数据吞吐量。

另一种是通过软件的方式在不更换已有硬件设

备的基础上实现简单的节能效果。可以通过软件层

面上的调度,动态的将空闲结点关闭以达到节能的

目的。也可以通过将热数据迁移到部分磁盘上,并

使其余磁盘进入低能耗状态以达到降低功耗的目的。

文章[6]提出了一个用于设计和度量 Map-reduce 集群

电能消耗的通用框架,提出使用全部结点执行任务,

在任务完成后关闭全部结点的策略。在大部分的

Map-reduce 任务执行情况中,这种策略能够取得更

快的响应时间和更低的能源消耗。文章[7]开发了

BEEMR 系统,BEEMR 的任务管理与 Hadoop 中的

Map-reduce 任务管理比较类似,但是在计算结点任

务分配执行策略上有很大的不同。BEEMR 将集群

分为两个子集群,处于随时等待执行任务状态的交

互式集群和处于低功耗的状态的批处理集群。当任

务对响应时间有要求时使用交互式集群处理;否则,

使用批处理集群,以达到降低能耗的目的。

通过软件技术节能需要修改运行系统的源代码

来实现调度控制功能,但是数据中心中运行多种软

件系统,源码修改的工作量很大,虽然降低了硬件

成本,但是大大增加了软件成本。另外,修改过的

系统移植性较弱。而通过降低硬件功耗来降低整个

平台的功耗是最直接有效的方法。但已有的研究工

作选择的应用场景太过单一,而且不能反映当前最

新硬件发展下系统的性能功耗对比。因此,需要有

这方面的探索来给出一个针对不同应用场景下的硬

件选择的参考。

2 大数据管理系统测试方案

在本文中,我们针对 Hadoop 和 HBase 进行大

数据管理系统的性能和功耗研究。

Hadoop 是我们进行大数据分析的典型的代表,

在大数据分析挖掘方面,在 hadoop 上使用蒙特卡罗

方法估算圆周率 π 值,并进行程序测试,设置 10

个 map 并使用 10000 个样本进行估算,考察在处理

非海量数据、内存占用较少、主要使用 map-reduce

计算能力的数据处理程序在不同硬件平台的性能表

现。同时使用 Pagerank[8]程序来分析系统在处理大

量数据时的功耗和性能。

Hbase 在大数据存储分析中同样充当着典型的

角色,在大数据存储的场景下,我们使用如表 1 所

给出的四种不同读写比例来测试HBase的性能和功

耗。针对 HBase 的性能测试需要根据不同硬件平台

对 HBase 进行参数的调优。为了保证本文的测试结

果具有一定的参考性,我们使用的大部分的参数都

是 HBase 默认的参数设置,但是针对不同平台的

CPU 能力和内存容量,调试了 HBase 的缓存比例、

Region 的 Handler 的个数等参数以便能发挥出硬件

平台的最优性能。HBase 也提供对于存储数据的压

缩方法,将 columnfamily 置为压缩可以有效的利用

CPU 的处理能力将需要存储的大量数据压缩存储,

减少了存储消耗的空间。在测试中我们分别使用了

非压缩的数据表和压缩的数据表进行对比测试,压

缩方式为 HBase 自带的 gzip。

Table 1 Read & write percentage of HBase

表 1 HBase 的读写比例

负载 读 写 扫描

W 0 100 0

WR 50 50 0

R 100 0 0

S 0 0 100

本文在Yahoo!推出的YCSB测试工具基础上开

发了分布式的测试框架,使用多个结点作为测试客

户端,当需要执行性能测试时,只需要在总控端执

行命令,各个结点就会同时执行测试,最后将测试

结果汇总到总控结点。同时每个结点的读写比例设

置、并发线程数等参数也在总控结点设置,不需要

针对每一个结点都编写一个配置文件。此外,由于

HBase是将数据存储到对应的Region中,如果这个

Region的数据超过了一定的阈值,那么这个Region

就会分裂成两个Region,并可能会在存储结点间有

数据的迁移。在测试时,当数据导入到HBase之后,

可能会伴随着大量的Region分裂和为了维护负载均

衡而导致的数据在结点间的迁移,因此在数据刚刚

Page 27: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

导入到HBase中时集群间的数据通信量会很巨大,

同时每个结点也需要占用大量的CPU时间来处理

Region的关闭、分裂、开启等状态变化,所以在系

统没有稳定时HBase并不是一个很好的工作状态。

在测试中我们会使用nethogs工具检测存储结点的

网络通信,当各个结点间的网络传输趋于平稳、

HBase的Region数目停止增加,再开始进行下一阶

段的测试,其具体的网络拓扑图如图1所示。

Fig.1 Test topology of x86 platform

图 1x86平台测试拓扑图

3 x86 平台下的性能与功耗测试

本节使用x86架构下的不同CPU平台运行大数

据管理系统,同时使用固态硬盘加速系统的吞吐效

率,分析了不同平台的基础性能,并测试收集了大

数据管理系统在这些平台上的性能表现和电能消耗。

3.1 硬件部署

x86 架构是复杂指令集,这种架构广泛地应用

在服务器、微型计算机、笔记本等设备上。在服务

器和个人电脑领域,Intel 和 AMD 是比较成功的两

家公司,市面上销售的 CPU 也基本出自这两家公

司。其中 Intel 占据了较大的市场份额,在台式机、

服务器中,凭借良好的功耗控制和突出的性能,成

为选购的主流配置,尤其在服务器市场中, Intel

的 CPU 占据了绝对的优势。

Intel 旗下的 CPU 针对不同的应用平台也有

不同的子品牌,针对服务器产品有至强系列 CPU,

可以为服务器提供高性能、稳定的计算能力,并支

持服务器平台需要的 ECC 内存校验技术和虚拟化

技术;针对 PC 产品有酷睿系列的 CPU,相比于服

务器产品支持的内存容量有大幅度的减少,但是在

功耗上也有所降低;针对移动或低功耗场景有凌动

系列处理器,它大幅度的降低了功耗,散热也得了

有效的控制,但是在性能方面也降低不少,不支持

ECC 内存校验和虚拟化技术,支持的最大内存容量

也偏少。

一、CPU

本文主要采用了 Intel 旗下的三款产品:至强

E5-2620、酷睿 i3-3220 和凌动 Atom D2700,涵盖

了服务器系列、桌面系列和移动系列。具体参数如

表 2。

Table 2 CPU type & parameters

表 2 选取 CPU 型号和参数

Intel XEON

E5-2620[33]

Intel Core

i3-3220[34]

Intel Atom

D2700[35]

系列 服务器至强系列 桌面版酷睿系列 低功耗 Atom 系列

内核数 六 二 二

线程数 十二 四 四

主频 2GHz 到 2.5GHz 3.3GHz 2.13GHz

缓存 15MB 3MB 1MB

工艺 32nm 22nm 32nm

TDP 95W 55W 10W

最大内存 384GB 32GB 4GB

内存通道数 4 2 1

售价 $410 $125 $52

二、硬盘

本文实验中使用的服务器型号为惠普 DL380p

Gen8,配置了 7200 转的 SAS 接口硬盘,并具有 1GB

缓存的智能阵列控制器,在瞬时的数据读写性能方

面占有较大的优势。在桌面版 CPU 平台选用了希捷

7200 转容量为 2TB 的硬盘,价格相对低廉。此外,

测试客户端

低功耗集群 桌面版集群

X86 测试环境 ARM 测试环境 电力检测仪

服务器集群

Page 28: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

我们使用了三星 840Pro容量为 128GB的固态硬盘。

三星 840Pro 的平均功耗只有 0.069W[9],远远低于

希捷磁盘平均 8W 的功耗[10]。同时其配备了 256MB

的内存缓存,4KB 的随机读写性能达到了

90000IOPS,在性能和功耗方面都具有比较大的优

势,但是硬盘容量相对较小。硬盘参数如表 3。

Table 3 Version of hard disk

表 3 硬盘型号

硬盘 型号 容量 价格

服务器硬

HP Smart Array P420i/1GB FBWC

智能阵列控制器

HP 7200rpm SAS 硬盘

1TB ¥4800

¥2400

普通硬盘 希捷 7200rpm SATA 硬盘 2TB ¥590

固态硬盘 三星 840Pro 128GB ¥890

三、其他硬件

服务器全部使用惠普 DL380p Gen8 的配件,配

置了 32GB 的 RDIMM 内存。在桌面版酷睿平台配

置了 8GB 的内存,使用了航嘉 jumper350 电源,额

定 350W,能源效率达到 82%以上。在低功耗平台

由于 Atom D2700 可使用内存容量的限制,只配置

了 4GB 的笔记本内存,同样使用了航嘉 jumper350

电源。在桌面版平台和低功耗平台上都使用 SATA3

(6Gbps)接口与磁盘和固态硬盘连接。各个平台

具体配置如表 4。

Table 4 x86 configuration

表 4 x86 平台具体配置

服务器 桌面版 低功耗

CPU 两颗 E5-2620 i3-3220 Atom D2700

内存 32GB 8GB 4GB

存储 1TB SAS 硬盘 2TB SATA 硬盘或

128GB 固态硬盘

2TB SATA 硬盘或

128GB 固态硬盘

整机价

¥32500 ¥2717 或

¥3017

¥1568 或

¥1868

本文使用了基于上表的三种硬件平台,其中在

桌面版和低功耗版又分别使用了磁盘和固态硬盘分

别进行了测试,因此总的测试平台为服务器版、桌

面版、桌面 SSD 版、低功耗版、低功耗 SSD 版。

3.2 平台搭建

本节基于以上硬件环境,共有5种硬件平台:服

务器集群、桌面版集群、桌面版SSD集群、低功耗

集群和低功耗SSD集群,每一个集群都配置了三个

结点,其中一个结点作为主结点,另外两个作为从

结点。这些集群都使用同一个交换机连接到一个局

域网中,同时使用三个与服务器结点相同配置的测

试客户端结点,使用高配置机器来产生多线程发送

测试命令,避免测试客户端成为系统性能测试时的

瓶颈。

每个测试结点都安装了Ubuntu 12.04lts版本的

操作系统,部署了Java Hotspot 64位虚拟机,版本为

1.6.0_24,每个测试结点安装系统监视软件zabbix[11],

实时收集当前的CPU负载、内存占用和网络通信等

信息,通过分析收集到的测试时各个平台结点的系

统信息,我们可以定位硬件平台可能存在的瓶颈和

问题,不断调优环境参数和系统设置,发挥硬件平

台的最大能力。此外,我们使用北电仪表Powerbay

专业版监控仪器[12]监测和收集功耗数据。

3.3 测试用例

我们使用Pagerank作为大数据分析场景下的性

能测试程序,生成接近104万的结点和461万的边作

为测试的数据集。在大数据存储的场景下,我们使

用四种不同的读写比例来测试HBase的性能和功耗。

3.4 实验及结果分析

3.4.1 硬件平台基础性能与功耗

由于大数据管理系统是分布式系统,网络环境

和结点间的通信能力会很大程度上影响系统运行的

性能,同时对于数据存储系统,存储设备的读写速

度也会成为制约系统运行的关键因素。我们对三个

平台的五种搭配进行了基础性能功耗测试,测试结

果如表 5。

Table 6 Basic performance & power consumption of hardware platform

表 6 硬件平台的基础性能及功耗

结点间最大

带宽

数据传输 存储设备

IO

待机功耗

服务器集群 944Mbit/s 42MB/s 304MB/s 290W

桌面版集群 944Mbit/s 42MB/s 192MB/s 77W

桌面版 SSD 集群 944Mbit/s 72MB/s 507MB/s 60W

低功耗集群 944Mbit/s 21MB/s 188MB/s 75W

低功耗 SSD 集群 944Mbit/s 22MB/s 245MB/s 58W

Page 29: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

通过测试结点间的网络情况可以发现,结点间

都是以 1Gbps 的网络带宽相互连接的。使用 dd 命

令向存储写入 10G 大小的文件,配备固态硬盘的桌

面版集群可以达到 507MB/s的速度,但是由于Atom

D2700 芯片只能支持 SATA2 接口,固态硬盘速度

的优势没有能够在低功耗平台得到体现。同时使用

固态硬盘的桌面版集群结点间的数据传输可以达到

72MB/s 的速度,但是 Atom D2700 的数据传输却比

较低,可能是由于其主板在网卡和存储接口间的数

据传输限制了性能。在待机功耗方面,服务器由于

使用了两颗 CPU、多条内存、Raid 卡等服务器组件,

三台服务器的功耗达到了 290W,远远高于桌面版

和低功耗版的待机功耗,运行一个服务器集群所消

耗的电能相当于运行三个桌面版集群所消耗的电能。

使用了 SSD 的集群会比没有使用 SSD 的集群平均

降低 17W 的功耗,低功耗集群因为使用固态硬盘其

待机功耗降低了 22.7%。虽然低功耗 CPU 的 TDP

要低于桌面版的 i3-3220,但是其集群的待机功耗与

桌面版待机功耗相当。这是因为 i3-3220 使用了更

先进的 22nm 工艺,动态节能技术的应用也使其在

低负载的情况下能够有效的控制电压和频率,使其

待机的功耗可以和 Atom D2700 相媲美。

3.4.2 Hadoop 数据分析的性能功耗

我们针对 Hadoop 的数据分析场景,分别进行

了 PageRank 和 Pi 的测试,具体的测试结果如图 2

和图 3:

Fig. 2 PageRank Performance & power consumption of x86 platform

图 2 x86 平台 PageRank 的性能功耗

Fig. 3 Pi Performance & power consumption of x86 platform

图 3 x86 平台 Pi 的性能功耗

在运行 PageRank 的测试中,服务器版、桌面版

和桌面 SSD 版的集群在性能上的差别较小,虽然桌

面 SSD 集群使用了固态硬盘,但是并没有对系统运

行 PageRank 在性能上有较大的提升。同样,在 Pi

的测试中,使用了固态硬盘对执行任务也没有显著

的影响。使用低功耗 Atom D2700 的硬件平台相比

于其他平台,在性能上有着显著的差距,一方面由

于 Atom D2700 这个 CPU 的运算能力要远远落后于

其他两个 CPU,在运行任务时的 CPU 平均空闲率

为 14.62%,最小值达到了最低的 0%;另一方面,

由于内存容量的限制,只支持 4G 内存的低功耗版

集群在运行需要大量内存用于计算的 PageRank 时

有着明显的劣势。通过系统监控软件我们可以看到

在测试过程中单个处理结点的最小剩余内存,如表

6。当物理内存有限时,需要使用系统的虚拟内存进

行数据的换入换出,这大大增加了系统的执行时间。

从实验结果中可以看出,桌面版集群运行

map-reduce 任务的性能与服务器集群的性能相差不

大,但是在功耗上只是服务器集群的三分之一。虽

然其在待机功耗上与低功耗集群相差不多,但是在

系统负载较大需要系统满载运行时,CPU 的主频会

有提升,功耗会比低功耗集群要高一些。低功耗集

群所消耗的电能最少,但是系统性能也最低。

Table 6 PageRank system state on x86 platform

表 6 x86 平台 PageRank 的系统状态

CPU 空闲最小值 剩余内存最小值

服务器版 80.74% 11697.2MB

桌面版 19.72% 2802.3MB

桌面版 SSD 19.92% 1369.9MB

低功耗版 0% 85.88MB

低功耗 SSD 0% 96.83MB

Page 30: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

3.4.3Hbase W 负载性能功耗

针对于 HBase 的 W 负载,我们测试了使用压

缩的表和不使用压缩的表两种情况,具体的性能和

功耗数据如图 4。

Fig. 4 W-load Performance & power consumption of x86 platform

图 4 x86 平台 W 负载下的性能功耗

在功耗方面,使用压缩算法和不使用压缩算法

所消耗的电能相差不是很大,但是使用压缩算法后,

在 W 负载中的性能要相比不使用压缩算法有一定

程度的下降,这也是通过占用更多的 CPU 时间对数

据进行压缩来减少数据占有的空间。在我们测试的

过程中使用的压缩算法是 HBase 原生支持的 Gzip

压缩算法,这种压缩算法的压缩率较高,但是压缩

数据的吞吐率可能会限制系统的写入速度。在测试

中插入了 3000 万条数据,没有使用压缩算法所占的

空间为 49.21G。使用压缩算法后,3000 万条数据一

共为 22.97G,所消耗的存储空间减少了一半。但是

相应地,无论使用服务器 CPU 还是固态硬盘,在

W 负载下的最大写入性能还是与不使用压缩算法

有一定的差距。

在 W 负载中,使用固态硬盘会对系统有一定程

度的性能提升。在表 4-5 中所示,桌面版 SSD 的存

储 IO 性能超过了服务器集群。同时,由于大量的

写入操作会造成 HBase 的 Region 进行频繁的分裂,

这个过程也需要消耗一定的 CPU 处理能力来完成

Region 各个状态间的切换,因此低功耗平台由于

CPU 性能的差距,在 W 负载下相比于其他平台有

不小的差距。表 7 显示了在 W 负载下的一些系统信

息,三个平台都消耗了大量的内存,这也是由于

HBase 会将数据先写到内存的 Memstore 中以提供

较高的写性能,当 Memstore 达到一定阈值再将数

据写入磁盘的这种机制造成的。由表 7 也可以看到,

在负载较高的情况下,桌面版和低功耗版的 CPU 的

处理时间都接近被占满,但桌面版集群可以提供良

好的性能。

Table 7 W-load system state on x86 platform

表 7 x86 平台 W 负载的系统状态

CPU 空闲最小值 剩余内存最小值

服务器版 51.79% 179.41MB

桌面版 6.66% 99.02MB

桌面版 SSD 5.2% 99.57MB

低功耗版 2.04% 92.38MB

低功耗 SSD 1.34% 97.11MB

3.4.4 Hbase WR 负载性能功耗

在 WR 负载中,读操作和写操作的比例各占

50%,具体的性能和功耗数据如图 5。

Fig. 5 WR-load Performance & power consumption of x86 platform

图 5 x86 平台 WR 负载下的性能功耗

在功耗方面,同样使用压缩算法和不使用压缩

算法所消耗的电能差距不大,服务器版消耗的电能

仍然最高,低功耗使用固态硬盘的集群耗电量最低。

与 W 负载下的性能不同的是,在 WR 负载中使用

压缩算法得到的性能要明显好于不使用压缩算法。

虽然在写入数据方面,将数据压缩之后再进行存储

会降低系统的吞吐率,但是其在读数据方面会占有

很大的优势。将数据压缩不仅会节省存储结点的硬

盘空间,同样这种方式也会大大减少硬盘和网络的

IO。同时,由于数据所占的空间更小,可以将更多

的数据存放在内存中,当所需要读取的数据在内存

中时,直接就可以将数据返回,节省了到存储的

HFile 文件中查找数据进行合并的时间消耗。此外,

Page 31: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

使用固态硬盘仍然显著的提升了集群的性能,当数

据不存储在内存中时,固态硬盘较高的随机读取速

度相比于磁盘要有明显的优势,同时也降低了集群

的功耗。在 WR 负载中,几个集群并没有出现系统

长时间过载的情况,但是由于低功耗集群存储的 IO

相对较低,且没有充足的内存,在 WR 负载下的性

能还是要比其他平台下的集群降低不少。

Table 8 WR-load system state on x86 platform

表 8 x86 平台 WR 负载的系统状态

CPU 空闲最小值 剩余内存最小值

服务器版 48.61% 206.4MB

桌面版 31.33% 145.48MB

桌面版 SSD 29.24% 179.7MB

低功耗版 17.12% 102.99MB

低功耗 SSD 18.06% 142.03MB

3.4.5 Hbase R 负载性能功耗

R 负载测试了 HBase 对全部为随机读操作的性

能,具体的性能和功耗数据如图 6。

Fig. 6 R-load Performance & power consumption of x86 platform

图 6 x86 平台 R 负载下的性能功耗

在 R 负载下,使用压缩算法也比不使用压缩算

法的性能有一定程度的提升。在测试中,为了使

HBase 在全读取操作的负载下达到理想的性能,我

们调高了 HBase 配置的缓存比例参数 BlockCache,

对于读负载较重,且读数据分布不均匀的场景,增

大系统的 BlockCache 参数可以有效的提升系统的

性能。当数据不在 BlockCache 中缓存时,使用固态

硬盘可以极大的提升系统的性能。固态硬盘在随机

读方面相比于传统磁盘有着数量级的差别,使用

SATA3 接口连接固态硬盘的桌面版平台可以将系

统在 R 负载下的性能提升接近一倍。在这样的负载

下,固态硬盘可以很好的发挥其在读操作方面的优

势。针对一次写入,多次读取进行数据分析的场景,

使用固态硬盘可以很大幅度地提升系统的性能。但

是在低功耗平台中由于芯片组只能支持 SATA2 的

接口,限制了固态硬盘的传输速率,因此在性能上

并没有很好的提高。表 9 显示了集群在 R 负载下最

大的负载值,各个平台下系统的平均 CPU 占用率不

是很好,但是在一些负载达到峰值时最低也达到了

19%。

Table 9 R-load system state on x86 platform

表 9 x86 平台 R 负载的系统状态

CPU 空闲最小值 剩余内存最小值

服务器版 66.57% 3354.24MB

桌面版 19.65% 116.31MB

桌面版 SSD 41.89% 121.06MB

低功耗版 19.34% 146.37MB

低功耗 SSD 50.35% 139.73MB

3.4.6 Hbase S 负载性能功耗

S 负载测试了 HBase 在处理扫描操作时的性能

和功耗。

Fig. 7 S-load Performance & power consumption of x86 platform

图 7 x86 平台 S 负载下的性能功耗

在 S 负载下,全部的操作都是对表进行扫描,

这也是对存储的数据进行大规模分析处理时经常遇

到的负载。由于测试时在两个存储结点插入的数据

达到了 3000 万条,HBase 分裂出了很多 Region。

一个 RegionServer 会管理几百个 Region,在对存储

Page 32: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

数据进行扫描时,RegionServer建立相应的Scanner,

需要消耗大量的 CPU 资源。从图 7 中可以看到,服

务器集群在 S 负载下的性能要远远好于其他平台的

集群,这也是因为服务器的 CPU 可以提供较好的性

能。此外,压缩数据存储和使用固态硬盘也都相应

的提升了系统在 S 负载下的性能。

表 10 显示了在 S 负载下的系统信息,使用两

颗E5-2620的服务器集群在最大负载时其CPU占用

率也接近达到了 87%,从此可以看出 S 负载对于硬

件平台 CPU 的性能消耗。桌面版平台在最大负载时

接近占用 100%的 CPU 时间,但是低功耗集群 CPU

空闲的最小值仅 8.04%,这是由于在对低功耗平台

进行测试时,如果使用相同数量的测试线程,低功

耗平台下的系统将会过载,性能也比较差。所以我

们将客户端并发线程数调小,使低功耗平台下的系

统达到一个最好的性能。

Table 10 S-load system state on x86 platform

表 10 x86 平台 S 负载的系统状态

CPU 空闲最小值 剩余内存最小值

服务器版 13.28% 193.71MB

桌面版 0.03% 126.98MB

桌面版 SSD 0.03% 101.52MB

低功耗版 8.04% 127.72MB

低功耗 SSD 19.57% 104.11MB

3.4.7 测试结果分析

在测试对比的硬件平台中,服务器集群拥有最

强的 CPU 处理能力、最大的内存容量,同时也具有

良好的 IO 性能,但是其功耗也最高,价格也最为

昂贵。桌面版相比服务器集群的 CPU、内存和 IO

性能都要逊色一些,但是无论是待机还是在系统负

载较高时都能保持良好的功耗,其配备固态硬盘后

IO 性能超过了服务器集群得到了大幅度的提升,也

因此在数据存取的 W 负载、WR 负载和 R 负载中具

有最高的性能,同时相比使用磁盘功耗有了进一步

的降低,具有最好的性能表现。但在 CPU 为瓶颈的

S 负载中,其性能仍要小于服务器集群。低功耗集

群具有能耗最低的处理器,但是 CPU 性能和内存大

小成为了系统的瓶颈,在各个负载中均要落后于其

他平台,虽然为低功耗集群配备了固态硬盘,由于

只支持 SATA2 接口的原因,系统并不能发挥出固

态硬盘的优势,但是其在高负载下仍能保持较低的

功耗是其最大的优势,如果需要处理的任务负载较

低,使用低功耗平台是一个很好的选择。

在图 8 中总结了测试使用的不同硬件平台在各

个应用场景和负载下的性能功耗比,即消耗了单位

能量所能处理的数据量。在图中对比的是相对的值,

即针对不同负载服务器集群的性能功耗比的值为 1,

其他硬件平台与服务器平台进行比较得到其相应的

性能功耗比值。从图中可以看到:

1)使用固态硬盘的桌面版集群在所有负载中都

具有最好的性能功耗比,其在各个负载中能达到的

性能也比较可观,同时这个平台的部署成本要远远

低于服务器集群,具有低成本、高性能、低功耗的

特点。

2)低功耗版本虽然在性能上与其他硬件平台相

比有较大的差距,但低的功耗使其在性能功耗比中

有良好的表现。

Fig. 8 Performance Per Watt of different hardware platform under various

load

图 8 不同硬件平台在各个负载下的性能功耗比

4ARM 架构下的性能与功耗测试

4.1 硬件部署

ARM 架构的 CPU 相比于 x86 架构的 CPU 有很

大的不同,ARM 使用了 RISC 指令集,避免了复杂

的指令,同时其具有芯片面积小、功耗低、成本低

的特点,被广泛地使用在手机、平板电脑等需要低

功耗的智能设备中。

由于并没有硬件厂商专门使用ARM架构的硬

件推出服务器产品,市场上也尚没有面向消费市场

的ARM计算机,在本文的测试中主要使用了基于

ARM架构的开发板。[13]中列出了目前一些组织推出

Page 33: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

基于ARM芯片的开发板。由于当前的所有ARM产

品还是32位的架构,所以其CPU理论上只能支持最

大4G的内存,现有的一些ARM开发板的内存容量

也因此比较低。在列出的ARM开发板中,我们选择

了具有2G内存、千兆网卡和SATA接口的cubietruck,

其使用了全志基于ARM架构的A20处理器[14]。

Table 11 ARM Storage parameters comparison

表 11 ARM存储参数对比

硬盘 型号 容量 功率 价格

笔记本硬盘 希捷 5400rpm SATA 硬

500G 1.2W ¥299

固态硬盘 三星 840Pro 128GB 0.069W ¥890

在存储方面,由于cubietruck的主板供电不能很

好的支持3.5寸的磁盘,因此在磁盘方面选择了希捷

的2.5寸500G笔记本硬盘[15]。笔记本硬盘相比于桌

面版的硬盘具有更低的功耗和较小的体积,但是其

性能也有所降低。同时也加入了固态硬盘进行对比

实验。为了与x86架构的硬件平台进行对比,实验选

取了基于x86架构的服务器集群进行对比实验。

Table 12 x86 server cluster vs ARM server cluster

表 12 x86服务器集群和ARM集群对比

服务器 ARM 集群

CPU 两颗 E5-2620 Cortex-A7

内存 32GB 2GB

存储 1TB SAS 硬盘 500GB SATA 硬盘或

128GB 固态硬盘

整机价格 ¥32500 ¥838 或

¥1429

体积 44.55 x 69.85 x 8.74 厘米 11.5 x 8.4 x 3.2 厘米

在整体的参数上,ARM集群和基于x86架构的

服务器集群有着非常巨大的差距,但是在价格上也

低廉许多,一台服务器的价格可以购买将近39台

ARM的计算结点。同时,服务器的体积也较大,实

验中使用了2U的服务器,在体积上可以安装排放88

个ARM结点。在机器密度较大、空间紧张的数据中

心中,能够减少计算结点的体积也是选择硬件平台

时重要的优势。

4.2 平台搭建

在测试平台中,我们选择了六个结点的惠普

DL380p Gen8 组成服务器集群,六个基于 ARM 架

构的开发板分别配置笔记本磁盘和固态硬盘组成

ARM 集群和 ARM SSD 集群。这些测试结点都连接

同一个交换机,部署在同一个局域网中。同时使用

了与服务器集群相同配置的六个服务器结点作为测

试的客户端,避免测试客户端成为整个系统测试过

程中的瓶颈。

在ARM的结点中,由于使用的CPU的架构不同,

运行的操作系统也不同。在服务器结点中使用针对

x86架构的ubuntu12.04lts 64位系统,使用Java

Hotspot 64位虚拟机。在ARM的结点中,使用了针

对ARM架构的Lubuntu13.08 Server版系统,同时使

用了基于ARM架构的openjdk。Lubuntu[16]系统是基

于Linux和Ubuntu的轻量级操作系统,它对于硬件的

要求比较低,更注重系统性能和功耗的平衡。此外,

我们同样配置了zabbix用来监控各个计算结点在运

行测试时的系统信息,可以更好的分析系统的问题

和瓶颈。

4.3 测试用例

针对于数据分析场景,同样也是使用了 Hadoop

PageRank 程序和 Pi 测试程序对系统进行测试。由

于 ARM 计算结点的内存有限,只能提供 2G 的内存

容量,因此运行数据规模较大的任务时,ARM 结

点并不能很好的执行处理任务。当任务需要的内存

空间大于硬件平台能够提供的内存空间时,系统就

会提示 JAVA 虚拟机能够提供的内存不足,任务就

会执行失败。因此在我们使用 PageRank 作为测试

程序时,选择的数据结点数相比于在 x86 硬件平台

使用的结点数有大幅的降低。我们使用了 1024 个结

点、2149 个结点之间的边作为 PageRank 的测试数

据。同时对 Pi 程序设置使用 10 个 map 并使用 10000

个样本进行估算。

在海量数据的存储场景下,我们同样使用了四

种不同读写比例的负载来测试HBase的性能。由于

数据存储结点既要运行Hadoop的数据管理进程,也

要运行HBase的RegionServer的进程管理对应的

Region,因此这也需要CPU具有良好的多线程的能

力。ARM结点的CPU计算能力较弱,因此其在运行

HBase时CPU的负载较高,为了发挥ARM集群的最

大性能,防止ARM存储结点的系统过载,我们在测

试时减少测试客户端并发请求的线程数,同时降低

了HBase的hbase.regionserver.handler.count、

Page 34: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

hfile.block.cache.size等参数,尽力将HBase在ARM

平台下发挥出最好的性能。

4.4 实验结果分析

4.4.1 硬件平台基础性能与功耗

每个集群基础性能功耗数据如表13。

Table 13 basic performance & power consumption of hardware platform

表 13 硬件平台的性能和功耗

结点间最大

带宽

数据传输 存储设备

IO

待机功耗

服务器集群 944Mbit/s 42MB/s 304MB/s 290W

ARM 集群 445Mbit/s 7.3MB/s 44MB/s 13.9W

ARM SSD 集

445Mbit/s 7.3MB/s 47MB/s 9.4W

测试中ARM结点间测试出的最大带宽只有

445Mbit/s,并没有达到1Gbps的理论最大带宽。同

时,使用磁盘作为ARM结点存储设备的IO为

44MB/s, ARM结点使用固态硬盘的存储IO也仅为

47MB/s。这说明存储设备IO性能的低下并不是存储

设备本身性能问题导致的,可能是由于ARM芯片能

力并不能很好的保证数据的吞吐。ARM结点间的最

大带宽为服务器结点间最大带宽的一半,但是数据

传输的速度却只有服务器结点间的六分之一。这可

能是由于ARM处理器的性能原因,造成数据在网卡、

内存和硬盘间的传输速率不够,ARM架构的CPU也

并没有很好的支持SATA接口。

ARM集群的待机功耗相比于服务器集群有着

数量级上的降低,从表13中可以看到,由三台服务

器组成的集群所消耗的电能可以支持15个ARM

SSD集群,也就是90个ARM SSD结点。单从功耗上

进行比较,ARM SSD集群具有非常大的优势。

4.4.2 Hadoop 数据分析的性能功耗

我们针对Hadoop的数据分析场景,分别进行了

PageRank和Pi的测试,具体的测试结果如图9和图10。

Fig. 9 Performance & power consumption of PageRank

图 9 PageRank的性能和功耗

Fig. 10 Performance & power consumption of Pi

图 10 Pi的性能与功耗

无论是PageRank还是Pi,ARM集群的性能与服

务器集群都有3倍的差距。服务器集群运行

PageRank程序只需要230秒,而ARM集群最快也要

1282秒才能完成计算。运行PageRank时的系统状态

如表14。

Table 14 performance & power consumption of hardware platform

表 14 硬件平台的性能和功耗

CPU 空闲最小值 剩余内存最小值

服务器集群 82.74% 15794.5MB

ARM 集群 0% 63.07MB

ARM SSD 集群 0% 62.84MB

从表14中可以看到,在运行PageRank系统负载

最高时,服务器集群仍然有很高的计算资源可以利

用,服务器提供的计算能力也超过了map-reduce程

序的最大需求,可以说对于这类的数据分析处理任

务,服务器集群的运算能力是过剩的。ARM集群在

运行PageRank系统负载最高时,CPU被100%占满了

运行时间,CPU的性能和内存的限制都阻碍了系统

的性能。但是ARM集群的功耗是服务器的十二分之

一,对于运行一些性能要求不是很高的任务,ARM

集群可以更节能地完成对数据的分析处理。

Page 35: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

4.4.3 Hbase 数据存储的性能功耗

ARM集群在数据存储场景下的性能与功耗数

据如图11和图12。ARM集群在运行HBase时,并不

能提供一个满意的性能。相比于x86硬件平台,ARM

平台运行HBase的性能有着非常大的差距,在所有

的负载下,CPU最小的空闲值都接近于0,系统处于

满负荷的状态。由于HBase的数据存储结点需要多

个线程来管理存储的数据,同时需要维护Memstore、

HFile等多种数据结构和文件,ARM架构的CPU并

不能提供很好的性能支持。此外较小的内存容量和

数据存储比较低的IO能力也极大限制了HBase在

ARM集群上的性能。

由于ARM的处理能力有限,因此测试客户端的

并发线程数也受到了限制。如果测试客户端使用较

多的线程并发地对ARM集群上的HBase进行操作请

求,这会在短时间内造成系统的过载,同时测试客

户端的线程也会收到大量的超时信息。较低的并发

请求处理能力也相当程度地限制了ARM集群在生

产环境中的使用。

Fig. 11 Data access performance of ARM server cluster

图 11 ARM集群数据存取的性能

Fig. 12 Data access power consumption of ARM server cluster

图 12 ARM集群数据存取的功耗

4.4.4 测试结果分析

在图13中总结了测试使用的服务器平台、ARM

平台和ARM SSD平台在各个应用场景和负载下的

性能功耗比。在图中对比的是相对值,即针对不同

负载服务器集群的性能功耗比的值为1,其他硬件平

台与服务器平台进行比较得到其相应的性能功耗比

值。

Fig. 13 Data access power consumption of ARM server cluster

图 13 ARM集群数据存取的功耗

由图13可以看出:

1)ARM集群在处理数据分析任务时更具有优

势,SSD ARM集群的性能功耗比为服务器集群的

5.1倍。

2)针对于负载较低、没有严格的相应时间要求

的数据处理任务,ARM集群可以在节省电能的同时

完成对大量数据进行分析处理的工作,是个相对好

的选择。

3)在处理数据存储的场景中,ARM集群的性

能功耗比虽然也与服务器集群接近,但是由于其提

供的HBase性能不具有可用性,因此也ARM集群也

并不适用于使用HBase作存储的应用中。

5 总结

本文使用了 x86 架构和 ARM 架构的硬件平台

进行大数据管理系统的性能与功耗的研究。

对于 x86 架构,我们使用了服务器平台、桌面

版平台、桌面版 SSD 平台、低功耗平台和低功耗

SSD 平台分别针对 Hadoop 的数据分析处理场景和

HBase 的大数据存取场景进行了性能和功耗的测试。

实验中我们得到了 Hadoop 和 HBase 执行测试的性

能,并记录了不同硬件平台待机和工作时的功耗。

在性能方面,服务器平台具有较好的优势,但是其

较高的电能消耗和高昂的部署成本成为了其最大的

Page 36: 数据管理前沿技术报告 - Renmin University of Chinaidke.ruc.edu.cn/reports/report2014/VisionSurveys/VisionSurveys.pdf · —ADEß$ŒŠ]‚LŽ8ºï$‡OŽ8æÆb #«`kq)`„º+â‘STÚŽUªäå.

缺点。同时我们可以看到,在大部分的应用场景中

并不需要服务器级别的硬件,使用桌面版的硬件就

可以达到相当的性能。桌面版 SSD 平台通过使用固

态硬盘较大的提升了数据的吞吐速率,并且较低的

功耗也相比服务器平台更加节能,在性能、成本、

功耗方面比服务器平台更具有优势。低功耗平台由

于内存的限制在数据分析场景下与其他平台有较大

的差距,但是由于其功耗控制良好,在高负载的情

况下也能保持较低的电能消耗,随着硬件厂商工艺

的改进,低功耗平台会成为极具竞争力的选择。

在 ARM 架构下,对于一些负载较低、相应时

间要求不高的任务,ARM 集群可以在提供一个可

接受的性能的前提下大幅度的减少能量的消耗,在

性能功耗比上相对于服务器集群有大幅度的提升;

在 HBase 存取数据的场景下,由于 CPU 性能的问

题,并不能提供一个很好的吞吐率。ARM 发展较

为迅猛,随着 64 位架构 CPU 的推出,ARM 平台也

会在未来的低功耗服务器领域占据一席之地。

本文在两种 CPU 架构下分别使用磁盘和固态

硬盘测试了以 Hadoop、HBase 为代表的大数据管理

系统的性能和功耗,给出了详尽的性能和功耗数据,

得出了有价值的结论,为数据中心的基础设施建设

提供了数据参考。

参考文献

[1]http://www.datacenterknowledge.com/archives/2013/09/17/google-has

-spent-21-billion-on-data-centers/

[2] Rabl T, Gómez-Villamor S, Sadoghi M, et al. Solving big data challenges

for enterprise application performance management[J]. Proceedings of the

VLDB Endowment, 2012, 5(12): 1724-1735.

[3] Pavlo A, Paulson E, RasinA, et al. A comparison of approaches to

large-scale data analysis[C]//Proceedings of the 2009 ACM SIGMOD

International Conference on Management of data. ACM, 2009: 165-178.

[4] Andersen D G, Franklin J, Kaminsky M, et al. FAWN: A fast array of

wimpy nodes[C]//Proceedings of the ACM SIGOPS 22nd symposium on

Operating systems principles. ACM, 2009: 1-14.

[5] Szalay A S, Bell G C, Huang H H, et al. Low-power amdahl-balanced

blades for data intensive computing[J]. ACM SIGOPS Operating Systems

Review, 2010, 44(1): 71-75.

[6] Chen Y, Alspaugh S, Borthakur D, et al. Energy efficiency for large-scale

MapReduce workloads with significant interactive analysis[C]//Proceedings

of the 7th ACM european conference on Computer Systems. ACM, 2012:

43-56.

[7] Fox A, Brewer E A. Harvest, yield, and scalable tolerant systems[C]//Hot

Topics in Operating Systems, 1999. Proceedings of the Seventh Workshop

on. IEEE, 1999: 174-178.

[8] Page L, Brin S, Motwani R, et al. The PageRank citation ranking: Bringing

order to the web[J]. 1999.

[9]http://www.samsung.com/global/business/semiconductor/minisite/SSD/

cn/download/Samsung_SSD_840_PRO_Series_Data_Sheet_rev_1_2.pdf

[10]http://www.seagate.com/cn/zh/internal-hard-drives/desktop-hard-driv

es/desktop-hdd/?sku=ST2000DM001#specs

[11] Zabbix. Available at http://www.zabbix.com

[12] http://www.northmeter.com/

[13] http://en.wikipedia.org/wiki/List_of_single-board_computers

[14] http://www.allwinnertech.com/clq/processora/20140214/85.html

[15]http://www.seagate.com/cn/zh/internal-hard-drives/laptop-hard-drives

/momentus-thin/?sku=ST500LT012#specs

[16]http://www.seagate.com/cn/zh/internal-hard-drives/laptop-hard-drives

/momentus-thin/?sku=ST500LT012#specs

[17] Chun B G, Iannaccone G, Iannaccone G, et al. An energy case for hybrid

datacenters[J]. ACM SIGOPS Operating Systems Review, 2010, 44(1): 76-80.

Meng Xiaofeng , born in 1964 . Professor and PhD

supervisor at Renmin University of China.Executive

member of China Computer Federation.His main research

interests include cloud data management , Web data

management,flash-based databases,privacy protection

etc.Email:xfmeng@ruc.edu.cn

Wang Fengming,born in 1991.M. S. candidate at Renmin

University of China.Student member of China Computer

Federation.Her main research focuses on cloud computing,

big data, online aggregation etc . Email :[email protected]

Guo Zhiliang,born in 1989, M. S. candidate at Renmin

University of China.Student member of China Computer

Federation.His main research focuses on the flash-based

database systems etc.Email:[email protected]