/ u% t( k# |- K& Q
如果大家对豌豆BI的数据预处理有一定了解的话,就知道数据预处理的简单易用性,可以在数据分析之前,处理数据不完整,重复,异常值等问题,通过简单的界面操作即可完成。通过对用户需求的分析,数据预处理增加了其他更好用的功能,本文将介绍这些简单易操作的功能。
0 M: w1 K% {7 w( d2 o
1. 字段信息统计
w5 A" o5 H) Z7 Q& l 在查看主题表数据,或进行数据预处理时,可以查到表中所有字段的各种统计信息,如最大值、最小值、唯一值,缺失值个数,合计值,均值,方差值大小,及数据分布情况。
* z$ F5 d( e2 n6 @! R
. L! H+ t' B) l3 x5 { 9 E; S7 J) ]# n5 _; U, M" A1 o% I; ~
打开凤凰新闻,查看更多高清图片
3 ]: m# |. {/ c" j% b8 A" H. t) P
; o7 Z0 c" k' |0 d$ N: h
+ p+ O: K: k: j' ]
2. 筛选生成新表
2 j7 [3 g- K9 C' c 对某列数据进行筛选后,工具栏上出现“筛选结果另存为Sheet”按钮,点击后即可将筛选数据存成一张新的表进行处理
- K) c! x8 N; \ X s

0 A# C; x: ?) D r ^+ ^
同时,可以框选界面中的任意部分数据,右键,点击“框选另存为Sheet”,将框选部分存为一张新表处理
: h0 Y) f6 y" y3 Z& e

2 V' h" _) O% n$ e* Z0 ` 3. 生成关联数据
8 B( b9 Y' N# q s6 z8 \ 选择任意多张表进行关联,表之间可以进行关联后,选择表的字段生成一张新的表,新的表数据是根据设置的关联关系生成。
1 {: P3 ]1 ^$ F, N; {! k U2 ^. p 1. 选择表做关联关系
. \ X% |: j5 \& i+ z$ S

* c! r0 q9 @; m9 `; a 2. 设置关联关系类型及关联字段
4 B+ Y6 I& p. Q

1 _; H; i) h6 a `2 l- y 3. 选择最终生成关联新表数据需要的字段
; \1 a! S4 K2 I; [ 
9 n5 i' J6 \ w1 v/ Q7 f
4. 主题表数据追加覆盖
& M- O" \& {. C+ ]% j7 e4 q% ~7 E
可以对主题表的数据进行追加或覆盖操作,此处是选择文件数据源中的文件数据,解析文件,通过设置字段对应关系,将文件中的数据追加或覆盖到主题表中。
* S) N4 m, H; h6 _8 ~
1.操作入口,主题表列表中,主题表后面更多操作中的“追加覆盖数据”按钮:
( E- ?4 |5 L6 u) H8 x3 Z, F. g

, A9 ]2 q4 v- q7 i, f2 f 2. 选择文件数据源中的文件,点击追加或覆盖
/ ^4 ], {# m T; P, J+ k$ m% ? 
% Z; j; _+ V i2 ?$ d% n; {8 P) i
3. 当选择的文件是EXCEL时,可以选择EXCEL文件中用户需要的工作簿,以及设置工作簿数据中的字段起始行及数据起始行
. ~, E" c% W# C% h3 y! m/ K 
, ~! a" ]% K" }* _ 4. 进入数据预处理,可进行数据简单的处理后再将数据追加或覆盖到主题表中
0 ?) |0 M, x- Y2 W* s' \ 
) g7 {1 s D: {" b$ Y) P
5. 点击追加或覆盖,设置字段对应关系,可点击按位置匹配或按名称匹配
2 f X3 X! j) S 
7 v; U' ]: ~0 G* ^- h, G) k 也可针对某一个字段自行选择设置字段对应关系
$ t" X, \( e1 v. o 
0 r w' y' P6 h8 C( L" `
设置完字段对应关系后,点击确定,即可将进行预处理的文件数据追加或覆盖到主题表中
# |' \8 \8 C5 g* a4 n