Python数据分析案例-药店销售数据分析
最近学习了Python数据分析的一些基础知识,就找了一个药品数据分析的小项目来练一下手。
数据分析的目的:
本篇文章中,假设以朝阳医院2018年销售数据为例,目的是了解朝阳医院在2018年里的销售情况,通过对朝阳区医院的药品销售数据的分析,了解朝阳医院的患者的月均消费次数,月均消费金额、客单价以及消费趋势、需求量前几位的药品等。
数据分析基本过程包括:获取数据、数据清洗、构建模型、数据可视化以及消费趋势分析。
数据准备
数据是存在Excel中的,可以使用pandas的Excel文件读取函数将数据读取到内存中,这里需要注意的是文件名和Excel中的sheet页的名字。读取完数据后可以对数据进行预览和查看一些基本信息。
获取数据:朝阳医院2018年销售数据.xlsx(非真实数据) 提取码: 6xm2
导入原始数据
数据准备
数据是存在Excel中的,可以使用pandas的Excel文件读取函数将数据读取到内存中,这里需要注意的是文件名和Excel中的sheet页的名字。读取完数据后可以对数据进行预览和查看一些基本信息。
获取数据:朝阳医院2018年销售数据.xlsx(非真实数据) 提取码: 6xm2
导入原始数据
数据清洗
数据清洗过程包括:选择子集、列名重命名、缺失数据处理、数据类型转换、数据排序及异常值处理
(1)选择子集
在我们获取到的数据中,可能数据量非常庞大,并不是每一列都有价值都需要分析,这时候就需要从整个数据中选取合适的子集进行分析,这样能从数据中获取最大价值。在本次案例中不需要选取子集,暂时可以忽略这一步。
(2)列重命名
在数据分析过程中,有些列名和数据容易混淆或产生歧义,不利于数据分析,这时候需要把列名换成容易理解的名称,可以采用rename函数实现:
(3)缺失值处理
获取的数据中很有可能存在缺失值,通过查看基本信息可以推测“购药时间”和“社保卡号”这两列存在缺失值,如果不处理这些缺失值会干扰后面的数据分析结果。
缺失数据常用的处理方式为删除含有缺失数据的记录或者利用算法去补全缺失数据。
在本次案例中为求方便,直接使用dropna函数删除缺失数据,具体如下:
(4)数据类型转换
在导入数据时为了防止导入不进来,会强制所有数据都是object类型,但实际数据分析过程中“销售数量”,“应收金额”,“实收金额”,这些列需要浮点型(float)数据,“销售时间”需要改成时间格式,因此需要对数据类型进行转换。
可以使用astype()函数转为浮点型数据:
在“销售时间”这一列数据中存在星期这样的数据,但在数据分析过程中不需要用到,因此要把销售时间列中日期和星期使用split函数进行分割,分割后的时间,返回的是Series数据类型:
此时时间是没有按顺序排列的,所以还是需要排序一下,排序之后索引会被打乱,所以也需要重置一下索引。
其中by:表示按哪一列进行排序,ascending=True表示升序排列,ascending=False表示降序排列
先查看数据的描述统计信息
通过描述统计信息可以看到,“销售数量”、“应收金额”、“实收金额”这三列数据的最小值出现了负数,这明显不符合常理,数据中存在异常值的干扰,因此要对数据进一步处理,以排除异常值的影响:
数据清洗完成后,需要利用数据构建模型(就是计算相应的业务指标),并用可视化的方式呈现结果。
月均消费次数 = 总消费次数 / 月份数(同一天内,同一个人所有消费算作一次消费)
月均消费金额 = 总消费金额 / 月份数
客单价 = 总消费金额 / 总消费次数
从结果可以看出,每天消费总额差异较大,除了个别天出现比较大笔的消费,大部分人消费情况维持在1000-2000元以内。
接下来,我销售时间先聚合再按月分组进行分析:
结果显示,7月消费金额最少,这是因为7月份的数据不完整,所以不具参考价值。
1月、4月、5月和6月的月消费金额差异不大.
2月和3月的消费金额迅速降低,这可能是2月和3月处于春节期间,大部分人都回家过年的原因。
d. 分析药品销售情况
对“商品名称”和“销售数量”这两列数据进行聚合为Series形式,方便后面统计,并按降序排序:
截取销售数量最多的前十种药品,并用条形图展示结果:
结论:对于销售量排在前几位的药品,医院应该时刻关注,保证药品不会短缺而影响患者。得到销售数量最多的前十种药品的信息,这些信息也会有助于加强医院对药房的管理。
每天的消费金额分布情况:一横轴为时间,纵轴为实收金额画散点图。
结论:
从散点图可以看出,每天消费金额在500以下的占绝大多数,个别天存在消费金额很大的情况。
医保药品倒卖大数据模型如何建立
数据收集、数据分析。
1、数据收集:收集医保药品倒卖相关的数据,包括医保药品的价格、销售量、销售地区、销售渠道、销售时间等信息。可以从医保管理部门、药品监管部门、药品销售企业等渠道获取数据。
2、数据分析:利用数据挖掘技术和机器学习算法,对数据进行分析和建模。可以采用聚类分析、关联规则挖掘、分类算法等方法,发现医保药品倒卖的规律和趋势。
医药生物可行性报告ppt一般介绍哪些方面
1.2.1 前瞻可行性研究步骤
1.2.2 生物医药项目可行性研究基本内容
(1)项目名称
(2)项目建设背景
(3)项目承办单位
(4)项目建设用地
(5)项目建设期限
(6)项目建设内容与规模
(7)项目开发建设模式
(8)生物医药可行性研究报告编制依据
1.2.3 前瞻对生物医药项目可行性研究结论
(1)前瞻项目政策可行性研究结论
(2)前瞻产品方案可行性研究结论
(3)前瞻建设场址可行性研究结论
(4)前瞻工艺技术可行性研究结论
(5)前瞻设备方案可行性研究结论
(6)前瞻工程方案可行性研究结论
(7)前瞻经济效益可行性研究结论
(8)前瞻社会效益可行性研究结论
(9)前瞻环境影响可行性研究结论
第2章:生物医药行业市场分析与前瞻预测
2.1 生物医药项目涉及产品或服务范围
2.2 生物医药行业前瞻市场分析
2.2.1 政策、经济、技术和社会环境分析
2.2.2 生物医药市场规模分析
2.2.3 生物医药盈利情况分析
2.2.4 生物医药市场竞争分析
2.2.5 生物医药进入壁垒分析
2.3 生物医药行业市场前瞻预测
第3章:生物医药项目建设场址分析
3.1 生物医药项目建设场址所在位置现状
3.1.1 项目建设地地理位置
3.1.2 项目建设地土地权类别
3.1.3 项目建设地土地利用现状
3.2 生物医药项目场址建设条件
3.2.1 项目建设场址地形、地貌、地震情况
3.2.2 项目建设场址工程地质与水文地质
3.2.3 项目建设场址经济条件
3.2.4 项目建设场址交通条件
3.2.5 项目建设场址公用设施条件
3.2.6 项目建设场址防洪、防潮、排涝设施条件
3.2.7 项目建设场址法律支持条件
3.2.8 项目建设场址气候条件
3.2.9 项目建设场址自然资源条件
3.2.10 项目建设场址人口条件
3.3 生物医药项目建设地条件对比
3.3.1 项目建设条件对比
3.3.2 项目建设投资对比
3.3.3 项目运营费用对比
3.3.4 项目推荐场址方案
3.3.5 项目场址位置图
第4章:生物医药项目技术方案、设备方案和工程方案
4.1 生物医药项目技术方案
4.1.1 项目生产方法
4.1.2 项目工艺流程
4.1.3 项目技术来源
4.1.4 推荐方案工艺流程图
4.2 生物医药项目设备方案
4.2.1 项目主要设备选型
4.2.2 项目主要设备来源
4.2.3 推荐方案的主要设备
4.3 生物医药项目工程方案
4.3.1 项目工程建设内容
4.3.2 项目特殊基础工程方案
4.3.3 项目工程建设规模
4.3.4 项目建筑安装工程量估算
4.3.5 项目主要建设工程一览表
第5章:生物医药项目节能方案分析
5.1 节能政策与规范分析
5.1.1 节能政策分析
5.1.2 节能规范分析
5.2 生物医药项目能耗状况分析
5.2.1 生物医药项目所在地能源供应状况
5.2.2 生物医药项目能源消耗状况分析
5.3 生物医药项目节能目标和措施分析
5.3.1 项目节能目标
5.3.2 节约热能措施
5.3.3 节电措施
5.3.4 节水措施
5.4 生物医药项目节能效果分析
5.4.1 装备节能效果
5.4.2 建筑节能效果
第6章:生物医药项目环境保护分析
6.1 生物医药项目建设场址环境条件
6.2 生物医药项目主要污染源和污染物
6.2.1 项目主要污染源分析
6.2.2 项目主要污染物分析
6.3 生物医药项目环境保护措施
6.3.1 大气污染防治措施
6.3.2 噪声污染防治措施
6.3.3 水污染防治措施
6.3.4 固体废弃物污染防治措施
6.3.5 绿化措施
6.4 环境保护投资预算
6.5 环境影响评价分析
6.6 地质灾害及特殊环境影响
6.6.1 生物医药项目建设地址地质灾害情况
6.6.2 生物医药项目引发发地质灾害风险
6.6.3 地质灾害防御的措施
6.6.4 特殊环境影响及保护措施
第7章:生物医药项目劳动安全与消防
7.1 编制依据和执行标准
7.1.1 项目编制依据
7.1.2 项目执行标准
7.2 危险因素和危害程度
7.2.1 安全隐患主要存在部位与危害程度
7.2.2 有害物质种类与危害程度
7.3 前瞻安全措施方案
7.3.1 工艺和设备安全选择措施
7.3.2 对危险作业的保护措施
7.3.3 对危险场所的防护措施
7.4 前瞻消防措施方案
7.4.1 火灾隐患分析
7.4.2 前瞻消防设施方案
第8章:生物医药项目组织架构与人力资源配置
8.1 生物医药项目组织架构
8.1.1 项目法人组建方案
8.1.2 项目管理机构组织架构
8.2 生物医药项目人力资源配置
8.2.1 项目员工数量
8.2.2 员工来源及招聘方案
8.2.3 员工培训方案
8.2.4 工资与福利
第9章:生物医药项目实施进度分析
9.1 生物医药项目实施进度规划
9.1.1 项目管理机构设立
9.1.2 项目资金筹集安排
9.1.3 项目技术获取转让
9.1.4 项目勘察设计
9.1.5 项目设备订货
9.1.6 项目施工前期准备
9.1.7 项目完整竣工验收
9.2 生物医药项目实施进度表
第10章:生物医药项目投资预算与融资方案
10.1 生物医药项目投资预算
10.1.1 项目总投资
10.1.2 固定资产投资
10.1.3 流动资金
10.2 生物医药项目融资方案
10.2.1 项目资本金筹措
10.2.2 项目债务资金筹措
10.2.3 项目融资方案分析
第11章:生物医药项目财务评价分析
11.1 财务评价依据及范围
11.1.1 财务评价依据
11.1.2 财务评价范围和方法
11.2 前瞻对生物医药项目销售收入估算
11.2.1 产品生产规模
11.2.2 项目实施进度
11.2.3 年新增销售收入和增值税及附加估算
11.3 前瞻对生物医药项目经营成本和总成本费用估算
11.3.1 费用估算基础数据
11.3.2 年总成本费用估算
11.3.3 年经营成本估算
11.4 财务盈利能力分析
11.4.1 利润总额及分配
11.4.2 现金流量分析
11.4.3 投资效益分析
11.5 财务清偿能力分析
11.6 财务生存能力分析
11.7 不确定性分析
11.7.1 盈亏平衡分析
11.7.2 敏感性分析
11.8 财务评价主要数据及指标
第12章:前瞻对生物医药项目社会效益与风险评价分析
12.1 社会效益前瞻
12.2 生物医药项目风险前瞻
12.2.1 项目风险定性分析
12.2.2 项目风险防范措施
第13章:附图、附表、附件
…………