以管窥豹——基于百度指数的大数据与游客市场特征分析

对于一个开展休闲旅游业的城市或地区来说,市场需求分析是旅游资源开发和旅游产品打造过程中重要的一环,没有弄明白市场,开发出的产品可能是失败的。

传统方法上,我们可以通过历史数据收集、问卷调查、行为观察、认知地图等方式对旅游市场数据进行研究,还可以对影响旅游市场特征的一些因素进行研究,比如收入、闲暇时间、年龄、教育程度等等。对现状和历史数据的研究,可以帮我们搞清楚当前的游客市场特征,对相关区域的经济社会发展情况进行宏观研究,可以找到未来休闲旅游市场开发的新方向。

然而,有时候,我们并没有太多的精力投入到实地调查的过程中,而政府部门或景区单位又没有进行详细的历史统计。这时候,除了访谈和现场观察外,借助于百度指数,我们或许可以以管窥豹。

比如,我们想了解到北京自助游的游客特征。以经济发展水平和距离等因素来初步考虑,天津、河北、山东及江浙一带可能是主要的客源市场。那究竟如何呢?
打开百度指数:http://index.baidu.com/
关键词输入“北京旅游”,新页面中,默认的功能是“趋势研究”,这时候我们看到出现了一个折线图。时间段这块,我们选“全部”。会看到从2011年到现在网友们各时期对“北京旅游”关键词的搜索情况。可以看到,这几年来,在每一年的时间里,清明节、五一前后是一个高峰;夏季是一个高峰;十一又是一个高峰。可以看到13年十一期间对北京的关注度达到历史峰值,但是15年好像大家不怎么愿意来北京了呢,都出国买买买了吧。

QQ截图20151215153924

切换到“需求图谱”。我们看到这些搜索“北京旅游”关键词的人,还搜索了一些别的什么。北京旅游景点、攻略等等,看来他们真是想要来玩耍的了。可以输入多个关键词与刚刚输入的“北京旅游”关键词进行比对,你自己可以试一下。

QQ截图20151215154018

再切换到“人群画像”,时间我们设置的长一些,比如13年到15年。可以看到,这两年中,搜索这个关键词的人,北京排在第一位,其次就是浙江、广东了,但后面的几个省市的总量感觉很相似。

QQ截图20151215154050

还是这个地方,我们把“省份”切换为“城市”,可以看到前三位的城市为北京、上海、天津。“在北京的人”对本关键词的搜索最多,这其中包括很多外地游客到京后的搜索,当然也反映出北京本地周边休闲旅游市场的需求旺盛。

QQ截图20151215154108

从搜索者的年龄和性别来看,中青年为主,这也与网络搜索习惯有关;男女比例7:3,男同志好像对北京更感兴趣一些。QQ截图20151215154323

怎么样呢?可以从百度指数,对北京旅游的游客有一个大概的了解,结合一些区域宏观数据的分析,可能游客特征会更加清晰起来。

但是,我们此项假设成立的前提是:来北京旅游的人会自己用百度在网上搜索“北京旅游”“北京景区”或与之相关的等关键词。很显然,大部分人会这么干,但也有相当一部分人不会这么干。我凭啥用百度搜?我对北京熟得很,我为啥要搜……即便是搜索的人当中,也很大一部分人并不会来北京旅游:我就是搜搜但就是不去呵呵呵……

因此,应用百度指数来验证某地的游客特征,应仅仅看作是其他研究方法的一个辅助,而不要过于迷信所谓的“大数据”。

ps:类似的大数据产品还有淘宝指数,看看那个地方的人爱剁手?

简述如何利用百度地图api获取poi并绘制交通等时线

早在三年前写过一篇利用百度地图自驾车线路数据绘制等时线的文章,惭愧的是当时那些数据都是我手动一个一个获取的。直到去年,研究了一下腾讯、百度地图的js api,才逐步找到一些可以省事的方法。现在将自己了解的一些土办法分享给大家。

首先我要绘制的是基于某一个地点到周边所有地区的自驾时间的这么一张图。我们可以反推一下,如何来绘制这张图。

在Arcgis中,如果要提取contour,那么要有dem或者tin,而dem也可以说是由tin生成的,故要想生成等时线,必须要有tin。tin从哪儿来呢?一个是可以从线要素创建,一个是可以从点要素创建,线是不可能了,因为我们是想求线,所以只能是点。也就是说我们要得到被分析的地点周边很多个点到该地点的自驾时间值,然后通过用这些点生成tin即可。

第一步:选取这些点。我要分析的地方是帝都某郊区县的一个地方,所以我选取了北京市及这个区县所相邻的外省各县的所有乡镇政府所在地、机场、车站作为分析的点。如何得到他们的名称和坐标信息呢?用百度地图的搜索功能。http://developer.baidu.com/map/jsdemo.htm#i1_4 这个链接所给出的实例讲述了如何用百度地图api搜索本地的内容。对这段代码稍微做一下修改,就可以得到刚刚所说的所有的镇政府、机场、车站的名称、地址或坐标。如果你会javascript,看一下他的说明文档,这应该是很简单的事。注意,在检索的时候,注意设定一下检索的范围,将city设为北京。如果你对js代码不太感冒,可以通过我编写的这个网页来实现此功能:点这里。

拿到名称和坐标之后呢,将得到的结果转存到excel中,备用。我取到了不到300条数据,如果你有耐心,可以以村为单位,估计能得到好几千条数据。

第二步:获取这些点到目的地的自驾时间。我们先看一下百度地图的自驾路线搜索功能,如下图,通过起点、终点搜索自驾线路,会得到时间、路程、红绿灯、打车时间等等信息。我们只需要取自驾时间就够了。

这个时候,需要看百度给出的这个实例:http://developer.baidu.com/map/jsdemo.htm#i5_5 这个链接给出的实例中,可以通过设置起点、终点,来查询驾车线路的时间和路程。

QQ截图20150721213619

 

我们对这个实例再进行一下改造,设置两个文本框。左边一个为输入框,右边一个为输出框。我们把第一步得到的坐标值按行的形式贴到左边输入框里面。修改实例代码,把原来的目的地按地址搜索改为按坐标搜索(当然,如果第一步你也取了地址,在这里不改也是可以的),然后以逗号将所取得的时间(s)、路程(m)进行连接,输出到右边的文本框中。如下图所示。这样的话,1分钟的时间里,就获得了近300条自驾时间、路程的信息。我把这个也放到了网上,具体可以看这:点这里。

WP_20150616_15_27_10_Pro

第三步:数据加工。剩下的就是捣鼓excel和arcmap了。把生成的用逗号分隔的数据,存为txt,导入到excel中,与第一步取得的名称、坐标数据进行匹配。得到一张完整的excel表。将这个表加载到arcmap中,将数据按照经纬度的字段加载到地图中。然后用arcgis的分析工具,好像是feature to tin,用点数据生成tin。然后tin转一个dem,就得到了下面这张图。

WP_20150616_15_42_35_Pro

 

原理已经说完了,不知道大家看明白了没有。