1 P( x! F- s E3 w! B
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
" E3 i3 ^' L+ ?7 u$ g 1. 字段信息统计
) ?! f4 S% B+ H4 c6 l& {7 u 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
! D* x+ @ l- i' B- ]
7 s) H: B3 [ k6 n$ o) P# i# I
6 p. v9 ?9 T4 W: |7 {2 l. G. g 打开凤凰新闻,查看更多高清图片
2 }& u2 e* {4 X! ]
# ]( c7 r5 y. b( u
8 ]5 b8 S' V: a6 j9 l 2. 筛选生成新表
! z- f* j/ ]3 t4 ^
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
( u7 u9 V# l9 p z& J1 F( D Y2 ]1 p

6 \4 n3 R' e5 m8 f8 u f6 t+ p
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
( ^0 N9 n8 X% y: Z 
) I! x2 G$ d$ ?4 l 3. 生成关联数据
1 {6 \2 G: q5 B- @ 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
2 `4 F# d$ _' S5 s ?; g a: e* s/ V# N
1. 选择表做关联关系
1 D+ Z) W- i g

1 ^& ?$ m) p9 k& \) U. n3 D$ {
2. 设置关联关系类型及关联字段
! G1 g% }+ B& i

7 d7 Q" B- L) ?5 F# v
3. 选择最终生成关联新表数据需要的字段
; ^0 m" Y" o( P* k3 J6 m H3 O

3 J, e0 X% f% o
4. 主题表数据追加覆盖
9 ?0 w$ X. a3 N. l: r& G+ V 可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
6 q c1 q6 X d# q% N: F 1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
& \) G' j3 W6 A 
8 J1 Z* X" t; V- H6 _, P; i1 C- \ 2. 选择文件数据源中的文件,点击追加或覆盖
, G9 D/ W! y. Y. r3 d @ 
" Z. q6 I+ ~: u* Q+ M 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
6 d0 m! H: T/ I% A3 P

, ~5 ~0 _4 t- m# O+ g$ [5 @. A# {
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
+ }! @; q% ?7 A" q. @

9 o# {% J' L$ o1 ^' I
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
6 X( w: N$ d1 x* t

& N3 ~ I( s$ x. Q/ S 也可针对某一个字段自行选择设置字段对应关系
$ @' E, u* p8 i 
& ?# |% J( O9 r4 W! | 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
- i4 x( h( X' j