代运营

daiyunying

从APP数据上报到可视化报表展示

iseeyu3年前 (2023-11-11)代运营149

我们每天都在使用各式各样的APP,我们的操作行为也不断地被APP的开发商收集,这些APP的开发商通过可视化报表平台,查看APP的用户行为数据。本文将试图揭秘,从用户触发操作,到这些数据形成可视化报表的整个过程。

声明下,本文是分享给产品经理们的。长久以来,关于产品经理要不要懂些技术,一直是1个有争论话题。个人理解,产品经理不需要懂太多技术,但要懂些技术上的基本过程。

所以,本文也将寄希望省略掉非常多的技术细节,说清楚从APP数据上报到展示的整个过程。

一、从SDK到可视化报表的整个过程

从APP端的统计SDK进行数据上报,到最后的可视化报表展示(T+1数据展示),可以概括为下面6个步骤:

  1. 统计SDK进行原始数据上报,上报到对应的接入服务器;
  2. 接入服务器把数据写入到队列中;
  3. 数据分析服务器对队列中的数据进行过滤分析,分析后写入到本地磁盘;
  4. 大数据计算服务器定时拉取本地磁盘的数据,进行大数据计算;
  5. 大数据计算的结果写入到报表数据库;
  6. 读取报表数据库数据,进行可视化报表展示。

以下,假定微信Android端,接入了TalkingData(以下简称TD) 的Android SDK,对SDK上报的部分步骤,进行解释。

按照假定,微信获得了1个TD的分配的APPID。该APPID,就是微信在TD这个统计平台的身份证,用于唯一标识微信自己的身份。

用户使用微信时使用的手机硬件信息,以及在微信上的操作行为,就会通过SDK进行上报了。

1. APP数据上报机制

APP数据上报的机制是什么样的?

基本情况是:

  1. 重新打开微信时,立即上报一次当前的启动数据以及上一次的缓存数据;
  2. 在使用微信的过程中,每隔2分钟(时间间隔可调整)上报一次数据;
  3. 将微信退到后台运行时,立即上报一次数据;
  4. 正在使用微信时,将微信杀死后,数据将缓存在本地,待下一次启动微信时进行上报。

以上4个上报机制,每个统计平台采用的不尽相同,有些平台提供可选项,由APP方自行决定上报的机制。

一个节省用户流量的极端上报机制是:本次启动所产生的数据,一直缓存在客户端,待下次启动时进行一次性上报(将上报的时间间隔设为24小时,即等同于本次启动中的数据,全部缓存在本地)。

通过Android的控制台,看到最后一行日志时,表示数据上报成功了。

09-24 11:40:31.810 I/TDSDKLog(11497): New data found, Submitting…
09-24 11:40:31.820 I/TDSDKLog(11497): New data len : 2804
09-24 11:40:32.240 I/TDSDKLog(11497): Data submitting Succeed!

2. SDK与服务器之间的对话

SDK和接入服务器的对话可以包括:

SDK:我已经按照参数格式,提交了数据了,你看下。

那么可能发生以下情形:

(1)正常情况

服务器的回复:哦,我看下,提交成功了。下次什么时候提交,你SDK自己来定哈。

(2)拒绝访

服务器回复:我跟你这个SDK没啥子关系,你无权访问。

(3)其他异常情况

服务器回复:这次提交成功了,不过服务器或者网络好像有点问题,下次提交的时间为30分钟后。

3. 对数据进行初步分析

步骤2,接入服务器把数据写入到队列中,是1个写数的过程。

我们着重详细介绍步骤3,对数据进行初步分析。

在步骤3中,服务器将对SDK上报的数据进行写日志操作。比如,可以按照SDK上报的数据格式输出json格式串,将json格式串写入到日志文件中。

定义好每个日志文件的生成规则,比如,每个20分钟生成1个日志文件,每隔1个小时生成1个文件夹(包含3个文件)。

接下来,就是对数据的初步分析,即对日志文件进行初步解析,将1个大文件,按照规则,切割成不同维度的小文件(表)。比如:切换成10个小文件,第1个小文件存储手机硬件信息,第2个文件存储手机的网络信息,第3个文件存储埋点事件,等等。

4. 进行大数据计算

经过了步骤3之后,原始数据的简单数据分析(分类)已经完成了,计算海量的数据,还需要专门的大数据计算平台,比如:Hadoop之类的。

比如:计算当前应用昨天的新增用户和活跃用户数,就可以使用Hadoop中的 mapreduce进行去重。

设想下,1个日活100万的APP,每个用户每天平均产生100条数据,那么就有1亿条数据,那么对于大数据平台来说,就有1亿个设备号,Hadoop要做的,就是对这1亿个设备号进行去重,得到当天的活跃用户数。

5. 可视化报表展示

步骤5,是大数据平台将计算好的数据入库的过程。

我们详细介绍步骤6,可视化报表展示,对数据进行展示。

在可视化报表中,我们可以看到多种多样的数据指标,昨日新增、昨日活跃、昨日启动次数、事件的发生次数、事件的发生人数。

以上数据展示,都是大数据计算后的结果。大数据计算的逻辑,来自于可视化报表的展示需求。

举例:昨日活跃用户数,既可以用昨日启动过应用的设备数来计算,也可以用昨日启动过应用的手机号数量来计算。前者就是大数据平台对设备进行去重,后者则是对手机号进行去重了。

三、小结

在本文的撰写过程中,省略了很多技术细节。

一方面,是因为本人的知识水平有限,无法准确描述;另一方面,本文的出发点,是让读者大致了解下从APP上报到可视化报表的过程,这个过程本是1个非常技术化的过程,涉及到非常多的技术要点,我们也需要有选择省略。

希望,本文对你有所帮助。

本文为@运营喵原创,运营喵专栏作者。

扫描二维码推送至手机访问。

版权声明:本文由西安泽虎代运营发布,如需转载请注明出处。

转载请注明出处https://0291.com.cn/post/20014.html

相关文章

不谈长期价值的明星直播都是耍流氓

不谈长期价值的明星直播都是耍流氓

围绕“直播对品牌是利是弊”的争议从未停止。 品牌与直播的关系,究竟是势不两立,还是唇齿相依?我问过许多人,他们各执一词。 有人将直播视作品牌增长的速效药。近几年,薇娅、李佳琦等头部主播对新品牌的助推作用令人印象深刻:花西子通过与李佳琦的深度绑定,迅速打开品牌知名度,今年618成为国货美妆领域的...

如何玩转微信红包封面?

如何玩转微信红包封面?

友情提示:马上就是春节了,在疫情还未全面压制的情况下,建议大家不要走亲访友,避免人员聚集! 中国是一个人情社会,既然不能面对面拜年,那么使用微信拜年就会成为大部分人的一个选择,那么在拜年的时候,红包是不是必不可少的呢? 一、为什么玩红包封面? 在我看来,微信...

全球社交媒体遭遇中年危机,下一个用户增长点在哪里?

全球社交媒体遭遇中年危机,下一个用户增长点在哪里?

所有的社交产品都有增长空间,三心二意的用户可能会离开,但那也可能是他们在不同产品之间的一场“迁徙”。 国外的社交媒体们正在经历一场集体水逆。 本以为 Snapchat 会一路高歌猛进,继续维持用户量和活跃度的高速增长,但 Q2 的财报着实给市场泼了一盆冷水,Snapchat...

实例分析:为何大而全的网站难以满足用户的需求?

实例分析:为何大而全的网站难以满足用户的需求?

随着信息数量的飞速增长,大而全的网站反而越来越难以满足用户的需求了。如果一个网站对于所有的领域都有涉及,意图服务所有的用户,那么它就有很大的可能被各种垂直类的网站所击败。一个典型的例子就是百度贴吧,它曾想包罗万象,但最终无奈走向没落。 最近不少老牌产品有一个很有意思的举动,它们...

互联网流量红利殆尽,在线旅游的下半场走向何方?

互联网流量红利殆尽,在线旅游的下半场走向何方?

要“紧紧”依靠互联网,而不是“仅仅”依靠互联网。 近几年,互联网在大数据和移动端的推动下,取得了飞速发展。于此同时,“互联网+旅游”的模式,带动了传统旅游行业的升级,即产生了“在线旅游”(OTA,Online Travel Agency)市场。 互联网流量红利几乎被收割殆尽,在...

拼多多的“种树得水果”游戏为什么能让人上瘾?

拼多多的“种树得水果”游戏为什么能让人上瘾?

我居然点开了长辈给我发的拼多多助力链接!   前几天,我居然点开了长辈给我发的助力链接。 像我这种浸在互联网多年的老油条,尤其还经历过拼多多的疯狂洗礼,本不应该点开这些换汤不换药的东西。 但我还是被这几个明晃晃的大字吸引了:“亲手种水果,包邮送到家”,好...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
现在,非常期待与您的又一次邂逅

我们努力让每一部企业宣传片和抖音短视频成为商业大片