HighLight
ChatBI:新增子产品ChatBI,可信的ChatBI,打造基于AIGC技术的智能数据分析助手
数据模型:新增关系模型,满足不同粒度事实表一同分析的场景,有效解决性能问题和数据膨胀问题
权限管理:新增资源权限管理,支持直接将报告等资源权限授权给用户,提供更高效率的权限管理体系
智能决策:支持基于数据模型中的用户邮箱和手机号,实现接收人和抄送人粒度动态分组发送
一、重点内容更新
1.1 ChatBI:可信的ChatBI,打造基于AIGC技术的智能数据分析助手
尽管有数BI中现有的自助取数产品模块中的「可视化取数」功能,已经极大地降低了业务同学取数的门槛,做到了只需要通过拖拽等操作即可获取数据。但还是无法避免需要前期对用户进行培训和教育,用户至少需要了解维度、指标、聚合、数据筛选等概念,并且能够使用对应的产品功能,是一种相对简单易学但不智能化的取数方式。
而AIGC的技术大爆发,ChatGPT的横空出世带来了对话问答这样的新型交互模式。网易数帆基于自研私有大模型的基础上,开发了全新的ChatBI产品模块。在ChatBI中,用户不需要面对工具,只需要与AI助手进行对话,就可以立即轻松获取数据,让企业真正实现人人用数、时时用数。
功能
- 需求可理解:AI自动理解用户提问并直接给出数据结果
- 过程可验证:支持以自然语言的方式解释查询条件,也支持以SQL的方式查看查询条件
- 用户可干预:用户可手动修改查询结果的条件,把AI给出的回答纠正为正确的回答
- 产品可运营:用户可对当前回答给出正确/错误的反馈,不断优化模型,提升模型准确率
- 其他:强大的图表绘制能力、多端互通、支持插件化集成、图表收藏
案例说明
一家大型连锁超市的华北地区的销售负责人,想看看今年上半年华北地区的利润情况:利润是涨了还是跌了,如果涨了,是什么原因?如果跌了,又是什么原因?
那么,他先问Chatbi第一个问题:今年上半年华北地区每个月的利润
ChatBI 通过对问题的理解和数据的解析,快速给出了回答。除此之外,我们将查询逻辑通过结构化的方式展示,用户可以通过查看查询逻辑或SQL,验证数据准确性。
在看了查询逻辑说明后,发现AI筛选的却是「发货日期」,但实际上用户想看的是「订单日期」在上半年的数据,于是可以点击「修改查询条件」,对查询条件进行校正:
修改查询条件后,拿到了正确的数据,但表格不利于查看趋势,于是可以修改图表样式,切成折线图。同时用户可以给AI一个反馈,告诉AI当前回答正确,不断提高AI的准确率:
1.2 数据模型:新增关系模型,满足不同粒度事实表一同分析的场景
我们在BI产品里创建面向分析主题的「数据模型」是数据分析的基础,但是基于原来数据模型的功能,无法有效解决“关联不同粒度事实表”统一分析的场景,比如以下两个场景:
(1)A表是每个商品的销售记录(商品id、订单id、订单金额),因为同一id的商品会被出售多次,所以商品销售记录表里有多个「商品id」;B表是每个商品的销售目标(商品id,销售目标),同一id的商品只有唯一的「销售目标」,所以商品销售目标表里只有唯一的「商品id」
- A表B表根据商品id直接关联(多对一关联),创建的数据模型中「销售目标」数据会膨胀(扩大N倍)
(2)A表是每个客户的贷款记录(客户id、贷款单id、贷款金额),B表是每个客户的存款记录(客户id、存款单id、存款金额),统一id的客户贷款记录和存款记录均有多条,所以两表中的「客户id」也有多条
- A表B表根据客户id直接关联(多对多关联),创建的数据模型中「贷款金额」、「存款金额」等指标同样会膨胀
为了解决上述多事实表关联为代表的度量数据膨胀的问题,有数BI现推出了「关系模型」功能。相关文章介绍《困扰老王多年的难题,关系模型一步搞定了?》
案例说明
接下来以直播电商计算GPM指标为例,给大家介绍下关系模型的实际应用。在直播电商场景下,比起GMV,大家更关心GPM(千次曝光成交量)指标,该指标的计算公式:
GPM=(GMV/曝光PV)*1000
GMV,即商品的成交金额,该数据存在商品的交易表中(如表1),而曝光PV则在商品的曝光数据表中(如表2),因此需要将商品交易数据跟商品曝光数据关联在同一个数据模型里,才能计算出商品的GPM。
(表1.商品交易数据表样例)
(表2. 商品曝光数据表样例)
而当我们需要把商品交易数据跟商品曝光数据用商品id字段直接关联(Join),就会产生数据膨胀:
因为表1是订单粒度的,同一个商品id存在多笔订单,一个商品id会对应多条记录。而表2是商品粒度的,一个商品id只会有一条记录。两个表用商品id进行关联(Join)后,表2中的曝光PV指标就会产生膨胀——“p0001”这个商品id在表1中出现过6次,表2中的曝光pv数据汇总后就会放大6倍(如下图),这样计算得到的GPM则会比真实值小很多:
虽然,可以先将表1按照商品id粒度聚合,再跟表2进行关联,如此不会发生数据膨胀的问题。但是表1中的sku、订单等粒度的信息也在聚合的过程中丢失了。无法在分析的过程中下钻到sku或者订单粒度查看交易数据。
利用本次上线的关系模型功能,则可以很好地解决上述问题。不同粒度事实表一同分析时,在保留事实表详细信息的同时,也不会产生数据膨胀。
步骤1:新建一个数据模型,打开“关系模型”的开关
步骤2:拖入要分析的“商品交易数据表”、“商品曝光数据表”
使用商品ID字段作为关联字段,建立两个表的关系。性能选项中可以选择“多对一”
步骤3:在报告模块引用该数据模型,并进行数据分析
拖入商品id、成交金额、曝光PV几GPM,可以发现曝光PV指标展示的值是正确的,未发生数据膨胀,由此得到了正确的GPM:
1.3 权限管理:新增资源权限管理,支持管理员主动赋权和用户自助申请权限
在此之前,有数BI中资源权限的设置和赋予是通过角色来实现的。这样的设计可以帮助用户基于角色来实现权限的统一管理,降低企业设置权限体系的复杂程度,但也失去了一定的灵活性,比如管理员期望对用户A赋予某个数据大屏的单独查看权限,得先建个角色再将角色赋予用户A,过程较长。
基于此,我们对资源权限部分做了升级,支持直接将资源权限授权给用户,实现精细化管控。相关文章介绍《权限体系很难用?今天我们来聊一聊资源权限》
功能
- 资源视角授权:通过资源权限管理模块,管理员能够看到项目中所有资源,可以从资源视角进行赋权
- 用户视角授权:在用户管理模块,管理员能够看到每个用户的最终权限,也可以给用户单独分配权限
- 按用户组/部门授权:如果希望整个用户组/部门的成员都有相同权限时,可以以用户组或部门为权限载体,批量分配权限
案例说明
假设你是一名项目管理员,进入项目中心-权限管理-资源权限管理,即展示当前项目下的所有资源,可通过下拉菜单筛选资源类型。我们以报告资源授权为例:
图片
点击【添加成员】按钮,搜索添加当前项目中的用户/用户组/部门,然后选择需要赋予的权限;点击确定后,即完成资源授权,下图中被添加的用户/用户组/部门即获得该报告的查看、复制数据和编辑权限。
图片
你还可以对已授权的用户/用户组/部门进行调整权限或移除,支持批量操作。
图片
1.4 智能决策:支持按数据中的接收人和抄送人粒度动态分组发送
在决策事件的实际应用过程中,当条件满足规则集时,需要给相关的人发送邮件、短信等通知,传统的做法是先添加接收通知的用户,设置后被添加的用户都会收到同样的消息,这种方式效率低下且缺乏权限控制。
因此决策事件新增「合并转发」功能,在配置决策流时,可以将接收人的邮箱或手机号字段与数据相关联,当条件满足规则集时仅通过邮件或短信等方式通知匹配的接收人,极大程度上提高了工作效率,节约了人力成本。
合并转发的配置操作如下:
(1)在决策事件管理列表添加一条决策事件,然后依次设置事件名称、描述、状态、执行频率和配置决策流,在配置决策流环节点击【添加执行动作】;
图片
(2)在弹窗中配置执行动作
- 通知方式选择邮箱或手机
- 接收人通过下拉菜单选择邮箱或手机号字段,可多选,抄送人同理
图片
- 将合并转发开关关闭,附加内容选择“数据表格”
(3)弹窗配置完成后,点击保存即可生效
图片
(4)合并发送开关开启和关闭时,附加内容选择了“数据表格”,不同的接收人接收通知情况如下图示例
- 开启:添加的接收人(抄送人)每个人收到的消息内容一样;
- 关闭:添加的接收人(抄送人)按业务字段值分组分别通知,每个人收到的消息内容不一样。
二、LTS8.8详细功能优化说明
2.1 ChatBI
(1)可信的“ChatBI”
- 需求可理解:AI自动理解用户提问并直接给出数据结果
- 过程可验证:支持以自然语言的方式解释查询条件,也支持以SQL的方式查看查询条件
- 用户可干预:用户可手动修改查询结果的条件,把AI给出的回答纠正为正确的回答
- 产品可运营:用户可对当前回答给出正确/错误的反馈,不断优化模型,提升模型准确率
(2)强大的图表绘制能力
- 支持切换表格、柱图、趋势图、指标卡、饼图等不同图表类型
(3)多端互通
- 支持PC端浏览器、移动端H5
- 支持语音,随时随地Chat
(4)支持插件化集成,可嵌入用户自有系统内
(5)其他功能
- 支持多表:支持根据提问自动选择表进行回答
- 支持大数据量导出,并支持导出任务管理
- 常用问题的回答可添加到收藏夹,下次进入可快捷访问
- 自定义提示词(Prompt),内置行业内的领域知识,让AI也能正确理解用户需求
- 支持表数据和字段值的预览,用户可快速知道有哪些数据,字段有哪些值可以问
- 更换回答:回答结果中支持直接重新换表回答,使用户可以主动纠正AI选错表的情况
- 字段联想:支持输入问题时联想字段,使用户提问时可以正确使用字段名称
- 提问参考:AI自动提供一些提问,新用户知道可快速“学会”向AI问问题
2.2 数据源
(1)数据模型:新增关系模型,满足不同粒度事实表一同分析的场景,在分析过程中实现先聚合后Join,有效解决先Join后聚合带来的性能问题和数据(指标)膨胀问题
(2)数据抽取:定时任务支持设置时间段,当任务频率为秒、分钟、小时时,可配置每日抽取任务执行的时间段
2.3 报告
(1)下钻组件:新增“下钻组件”,支持设置多个不同类型的图表之间完成下钻,比如可以从一个柱状图下钻到一个趋势图再从趋势图下钻到饼图等
(2)表格:支持界面化配置表计算
(3)交叉表:交叉表条件格式增加标记的图标种类
(4)交叉表:支持设置行高;列标题支持字段级别样式设置;支持导出时携带以上样式
(5)文本框:支持插入参数;设置跳转报告时支持传递筛选条件
(6)图表:地图地理角色映射支持重置(重新识别)功能
(7)图表:地图支持圈选、框选、自定义索套圈选选中区域或标记点
(8)图表:地图样式新增地图底图配置项,包含底图样式及显示内容选择
(9)图表:填充地图有数据、无数据项支持分别配置边界线颜色
(10)图表:数轴维度字段支持设置行高尺寸
(11)日期字段的无数据日期设置:可以按照选中的日期范围补全;并增加对“年-月-日-时-分-秒”粒度日期的支持
(12)筛选器与参数控制器:支持双向联动;双向联动时保留已选选项;导航模式支持图标大小等更多样式定义
(13)列表筛选器和树状筛选器:搜索支持不区分大小写
(14)日期筛选器:支持限制可选的日期范围;事件日历显示优化,增加显示具体的日期
(15)连续颜色:支持自定义数据的开始值/结束值/中心值与中心颜色
(16)参考线:支持设置参考线粒度(粒度为“轴”时,同一个字段(含“度量值”)拖入多次,可以分别设置参考线)
(17)表计算:表计算支持对所有分页的数据进行计算(最多2w行)
(18)计算字段:开放日期偏移函数DATE_OFFSET_QUERY,支持动态偏移量和PERIOD参数
(19)参数:默认值支持设置为表达式,满足更灵活的场景,比如默认选中昨日销售额最高的门店
(20)推送:依赖推送支持自定义依赖表
(21)定时推送和定时导出:支持设置开始、结束时间
(22)刷新计划:一个报告支持创建多个刷新计划;频率新增小时级别
(23)其他:
- 提示信息清空保存后图表tooltip不显示并新增恢复默认功能;
- 树状筛选器自适应高度优化;
- 跳转弹窗中图表的最大化查看优化;
- 总计跳转优化;
- 推送报告选择页面时的页面排序优化;
- 移动端Tab组件内表格左右滑动优化;
- tab控件交互优化;
- 交叉表和表格的带样式导出优化;
- 自定义字段显示优化
2.4 数据大屏Pro
(1)新增组件:轮播排行条形图、双层轮播饼图、矩形树图、滤镜、注释框、轮播组、3D轮播图、树形选择器组件
(2)组件支持同比缩放
(3)支持对多个组件进行“组合”操作
(4)图表间的联动方式增强,支持筛选、下钻、高亮三种联动方式
(5)组件支持开启“元素穿透”,鼠标点击行为将穿透该组件,选中其下层的组件
(6)组件的背景,可以设置为图片
(7)3D环形图组件支持设置提示框样式
(8)3D地区组件,支持自定义下钻后的展示视角
(9)折线图组件支持添加参考线子组件
(10)柱形图/条形图、栅格柱形图/条形图支持设置柱子的头部图标
(11)轮播表的行支持设置背景渐变色或背景图
(12)条形图提示框支持设置数据格式
(13)环形图数据标签指示线的位置支持偏移,标签内容支持单独偏移
(14)地理角色:支持设置字段的地理角色
(15)导出:导出大屏时,支持将依赖的数据模型、数据连接同步导出
(16)新建大屏时,新增30+模板供选择
(17)其他优化:
- 图表的上卷下钻icon支持设置位置偏移;
- 大屏列表页支持仅查看自己创建的大屏;
- 支持在组件列表中搜索组件,快速定位组件;
- 折线图支持设置y轴范围、文本可设置渐变色、自定义折线图标记点形状等
2.5 数据填报
(1)制式表单:列表筛选器支持配置排序;设置数据入库时,字段增加标题设置项
(2)动态表格:新增批量填充字段内容选项;支持上传CSV格式数据;数据入库支持更新和删除后插入
(3)动态表格/流式表单:选项字段支持配置码值作为入库依据
2.6 自助取数
(1)可视化取数:数据筛选手动输入开放原2w条限制,根据当前数据库限制数量来判断;
(2)导出:定时导出增加excel格式导出;优化邮件内容格式;导出Excel时支持分包导出策略;我的查询中增加导出功能;后台管理支持设置自助取数是否开启大数据量导出 、配置普通导出上限;
(3)权限:可以在角色管理中配置自助取数的分享、导出功能的权限;
(4)分享:公共查询支持分享,分享支持设置有效期;
2.7 智能决策
决策事件邮箱通知方式支持添加抄送人;通知内容支持按接收人+抄送人粒度分组发送(仅限接受人或抄送人为邮箱、手机号的数据字段时)
2.8 管理与其他
(1)权限管理:支持按资源授权,项目管理员可从资源授权模块直接给用户/用户组/部门赋予查看或编辑等权限
(2)数据权限:支持配置单独对部分填报生效;行级权限的动态值中支持设置当属性值为空时条件判定为True
(3)项目中心:安全配置增加配置项,可禁止数据模型中设置的计算字段在其他地方(如报告、取数等)被修改
(4)集成:报告的草稿态支持集成模式;所有集成页面在HTML节点增加特殊CSS选择器,以方便客户通过自定义CSS单独控制集成页面样式
(5)私有部署专有:导出的文件支持通过客户接口加密
(6)私有部署专有:支持双因素(账号密码+动态口令)认证登录
2.9 BUG修复
(1)数据准备:数据准备输出到外部数据库时报错
(2)数据准备:用中文逗号扩展字段后查看数据视图报错
(3)数据填报:动态表格批量上传数据时不会分页
(4)抽取:依赖抽取如果前一次抽取还未结束又触发了后一次抽取,后一次抽取可能报错表不存在
(5)报告:带总计的交叉表导出交叉表的问题 ,单元格内文字为小计导出变成总计