搞外贸网站优化推广的人,应该都接触过Google Trend。它能够分析产品关键词的偏离度、产品本地化、区域化的热度和上升/下降趋势。
但是,很多时候,我们围绕着产品搜索量分析的产品趋势,都无任何规律性的增长或者下降,就像没有解调之前的电波一样,让选品或者运营人无法决策。
怎么办?
今天给大家介绍SPSS数据分析——线性回归分析,在复杂产品趋势中的应用。
操作步骤如下:
1. 获取SPSS数据分析软件包(百度可搜索下载破解版SPSS)
2. SPSS安装与激活
SPSS的安装时,前几步与其他软件安装流程一样,点击“确定”或者“下一步”就OK。当弹出“产品授权”界面时,我们仍然点击“下一步”,
这个时候,会出现“输入代码”,大家将软件包里的“SPSS20无期限授权号”里面的激活码,复制粘贴过来,然后点击“下一步”,完成激活。
3. 数据采集
回到Google Trend界面,输入自己要查询的产品关键字,选择查询的时间序列,点击右上方下载按钮,保存本地。
4. 数据清洗与数据挖掘
我们主要用产品趋势数据,分析产品搜索量随着时间变化的响应趋势,时间的间隔为1个月,不存在缺失项,所以,就产品趋势的贸易数据而言,数据清洗和挖掘可以跳过。
大家不是搞数据分析的,没必要把时间,用在数据挖掘的算法上面。神经网络、贝叶斯控制,与我们无关。
5. 数据导入
打开安装好的SPSS数据软件,点击左上方文件图样按钮,选择刚刚下载的Google Trend数据(csv格式),将其导入到SPSS。
数据格式,选择“时间/日期”,将其设定为yy/mm/dd(个人习惯,大家可以根据自己的习惯,设置不同的时间表现形式)。
导入数据之后,我们要针对数据属性、分析目的进行简单设置。我们把”时间“当做输入,“搜索热度”作为输出。
6. 选择合适的数据分析方法
这次演示的案例,主要是产品搜索热度随时间的变化规律,所以,选择线性回归分析,来判断两者的线性关系。
当然,如果是研究肺癌与吸烟的关系,还要计算数据降噪处理、多元回归计算相关系数、复杂抽样、计算生存函数等等。
今天这个例子,单纯从数据表面看,二者之间并无强相关性,所以,就做线性回归分析足够了。
7. 分析过程
#1、选择分析——回归——线性(L)
#2、将自变量、因变量输入到对应位置。
#3、点击”统计量”,配置置信区间、模型拟合度、D-W值。
(1)置信区间95%:被测量参数的真实值,有95%的概率落在真实的预测结果。换句话说,我们做的时间与搜索热度的关系分析,可信度在95%以上。
(2)模型拟合度:回归分析,特别是线性回归分析,最终的二维、三维关系曲线,实际上都是根据变量的变化趋势,拟合出来的,存在一定误差。
(3)D-W值:在做回归分析时,随机误差项,往往都存在,因为自变量、因变量之间,有时内部是存在很多相关因子的。但是,我们又不希望这些随机误差之间自相关,换句话说,变量的内部之间,不能出现多元关联。
D-W的值越趋近于1.5,随机误差项(残差项)之间的相关性越小,那么,我们建立的回归模型,就越真实。
#4、点击“绘制”,勾选直方图、正态概率图
全部设置完毕,点击“确定”,进入数据分析。
8. 分析结果(报告)
D-W=1.602,说明回归模型随机误差项,相关度较弱,模型可信。
回归标准化残差=0.998:说明标准化残差落在(-2,2)区间以外的概率≤0.05,标准化残差符合标准正态分布N(0,1)。95%以上的数据测量值参与正常回归拟合,回归模型良好。
在此基础之上,我们拟合出来的曲线,才最接近于真实值。
由此,我们就可以大体上看出产品的搜索热度,随着时间的变化趋势。这将有助于我们精准选品,并且可观了解和预测产品全球推广的最佳时机。