$ _# o) b' R( M0 C' ^( f
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
6 I- S9 j, ^( [3 A# \ 1. 字段信息统计
% f* {2 D u, ^! F" e } 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
, ^% Z" Q, F' m: V2 @
0 q4 ~: N$ y1 h4 S , _/ r2 ]" p% M4 G
打开凤凰新闻,查看更多高清图片
! K$ t- s% L) k . i& U' ]5 Q2 R# `3 a
7 G. Y6 y. I- g0 N5 ~; g 2. 筛选生成新表
8 v& m# K% W. X! @5 b
对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
7 U, B+ K# B7 O: w6 V 
0 N/ r9 H8 V5 D+ w0 M. @; ? 同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
5 u* B! N% o7 z/ G2 r 
+ P" q$ A; ]1 j
3. 生成关联数据
7 L2 o, k& l( b
选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
6 n4 w5 Q' B+ v4 L
1. 选择表做关联关系
7 w l1 M6 k4 g; }; F

9 ]1 n. ^0 R3 A x3 U) @ 2. 设置关联关系类型及关联字段
) v. k3 x* g# D* O7 a! w+ y 
4 I1 g; u0 m z4 z: h7 _! X* {# v
3. 选择最终生成关联新表数据需要的字段
+ P: {* H' F1 i5 A9 j* a6 k% V

) P' O' d) x( V, }4 F 4. 主题表数据追加覆盖
; {7 V& u9 B7 @
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
5 C; ^+ K2 }) O3 E- }. b6 r
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
6 k; B i; {8 b+ l: \- r. C2 \

" G9 f, K0 n4 n, K1 d+ w! I 2. 选择文件数据源中的文件,点击追加或覆盖
- m% V" e$ J# w# p

! g$ a- |$ ]+ n+ `* P8 e9 [ A, k 3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
+ i$ ?5 a, ]! m, Z, ^& [ N9 A" t

& c E0 ^2 y$ d! q1 Z2 c0 [
4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
; R r, k7 [% T! K9 s8 F+ } 
9 S' h; T& k, p+ ?, d 5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
& s/ v2 r( ?, Q7 U 
2 O8 R$ L) j# C1 @/ @8 l8 N, y
也可针对某一个字段自行选择设置字段对应关系
( N8 N Y4 B& O q0 u# `! d3 v 
7 C8 x( I" L1 ?9 r8 y0 S 设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
# C5 I! |% p3 w* Z& L# b& }