北京 Tableau 可视化分析争霸赛作品分享 | 冠军赵龙飞:Tableau 让数据分析师成为艺术家

published: 2023-01-02

>>> 北京 Tableau 可视化分析争霸赛

选手统一使用主办方准备的电脑(不能上网),使用主办方统一提供的数据源(Excel格式、IMDB电影数据),现场30分钟内完成可视化分析作品,现场5分钟完成作品阐述。



今天,我们为大家分享北京站 Viz 竞赛的冠军作品:《一部电影的诞生》。

冠军得主:赵龙飞(来自京东金融)

这个 Viz 由六个仪表板组成了一个完整的故事逻辑:如果你是一个电影投资商,你该如何投资制作一部电影?

如何利用数据分析帮助电影进行决策支持,可以从五个角度开展:

  • 剧本创作,也就是要拍什么类似的电影,情节需要包含怎样的内容;

  • 投资选角,选哪个导演来拍,选哪个演员来演;

  • 拍摄剪辑,拍得很多小段电影,需要剪成多长时间;

  • 生成发行,一些定期的安排;

  • 映后复盘,最后是把整个做一个复盘。

我们按照作者的逻辑顺序,一张一张看看这六张仪表板分别能告诉我们什么。


一部电影的诞生

这幅图很有趣,很多数据粉都很好奇它是怎么做出来的。其实,这副图表应该是作者提前用思维导图工具做出来,然后拷贝到比赛电脑里用作图片素材。

这是整个故事情节的概述,为后面的各项数据分析做了很好的逻辑铺垫。作者不愧是“老司机”,各种工具都应用的驾轻就熟、融会贯通。


剧本创作

选择拍一部什么样类型的电影,电影需要包含什么情节。在做这个决定之前,需要先了解一下全球票房情况。

左上角的图表包括两部分内容,横坐标是时间轴、纵坐标是票房金额。

  • 上半部分的折线图是一个两年的平均线,目的是看市场的整体走向:从线图区域看,整体走势是向上的,但偶尔也会有一些波动。

可以发现一个有趣的现象:从2002年起,电影市场的票房出现规律波动,基本是“今年高明年低”的模式,电影公司可以根据这个走势决定电影的上映时间。

  • 下半部分的面积图,呈现出不同的电影类型所占的票房的比例。可以看到,下方的几个色块是票房比例比较高的电影类型。

  • 左下角是每一种类型电影的排名变化图,可以筛选出所有的22种类型,通过右侧的滑条进行类型数量的选择。为了图表能更清晰,作者设置成“只关注前五名”。

可以看出,近些年有四类电影:科幻片、冒险片、动作片,还有喜剧片,它们所占的票房比例较高。如果电影投资商想获得更高收益,恐怕得重点选择这四种类型的电影了。

再看看,高票房的电影通常会包含一些什么故事情节。

  • 右下角的这个图,作者按照票房的降序排列。可以通过点击右侧电影类型筛选器,来查看每种类型的电影通常所包含的故事情节的多少。

比如,我们看看深受欢迎的冒险片一般都包含什么故事情节。可以看到,冒险片比较多的剧情有孤岛、外星人、战斗、超级英雄、还有公主、漫画等。


选导演

一个好的导演也是一部卖座电影的票房保证。那么,电影投资商确定了投资的电影类型之后,就得考虑选哪个导演进行拍摄。

作者用近几年不同导演的影片票房数据做了一个分析图表:每个导演在IMDB的平均票房情况。横坐标是平均评分(评估电影质量),纵坐标是平均票房(评估电影收益)。

圆圈的大小代表这个导演在IMDB收获到的评论数多少,需要说明的是:并不是圆圈越大越好,因为有很多的评论可能是负面的。

根据每个导演所在的位置,可以把他们划分成三类:

■ 影片评分低且票房低

■ 影片评分高但票房低

■ 影片评分高且票房高

接着上面的问题,电影投资商选择的四种电影类型,该选择哪些导演拍摄呢?下端的图表,可以看到四种类型的电影,各个导演的具体表现。

答案很明确:需要选择一个既有高评分又有高票房的导演。那么,就可以在每种类型电影图表的红色圆圈中选择适合的导演了。


选演员

接下来,电影投资商该考虑演员的选择了。

作者把数据中的所有演员,从票房号召力和粉丝关注度两个维度进行分析。

  • 人名的字体越大,代表他(她)的票房号召力越大;

  • 人名的颜色越鲜艳,代表他(她)的粉丝关注度越高;

有趣的是,演员的票房号召力和粉丝关注度并不一定成正比。所以,就会出现三种选择:

  • 蓝色人名+字体大,票房号召力大但粉丝关注度不高

  • 橙色人名+字体小,票房号召力小但粉丝关注度高

  • 蓝色人名+字体大,票房号召力大且粉丝关注度高

具体该如何选择,主要还得看影片在这部分的预算情况。预算较高,可以选择第三种;预算一般,可以选择第一种;预算较低,就只能选择第二种了。


拍摄剪辑

电影拍摄的实际时长一般都很长,可以上映的成片不可能这么长,还需要做后期剪辑。但是,具体该剪辑成多长的一部电影合适,作者在这里做了相关的数据分析。

左边这个图表,横坐标是四种类型的电影、纵坐标是电影时长。每一个圆点代表一部该类型的电影,圆点面积大小代表它票房的高低。

把所有的票房做一个分筒,按照一亿的做一个分筒,把它再做一个纬度看。可以得出一个结论:每一类的电影,票房越高,它的分筒也会高一些。

所以,可以得出结论:好片不怕片长。不过,喜剧片相对其他三种类型,还是要短一些更合适。


映后复盘

最后,作者还希望能做一个电影放映后的复盘。但是因为数据本身的原因,没有完成。不过,我觉得这个复盘是很有必要的,数据分析可以帮助电影投资商清楚的了解自己的每一次决策行为。

不得不说,本次 Tableau 可视化分析争霸赛的冠军得主不仅思维缜密、逻辑清楚,口才也是非常了得。

最后,来欣赏一下赵龙飞在北京峰会现场对他的可视化作品所做的精彩阐述吧!

▽点击视频,观看赵龙飞现场精彩的作品阐述