分类: 数据分析

记录数学分析学习当中的各种坑!

7 篇文章

泰坦尼克号任务-模型建立和评估
机器学习相关知识 理解标签和特征的含义 以周志华老师在《机器学习》中判断好瓜的问题为例——给你一个西瓜,如何判断出一个它是不是正熟的好瓜?对于人类来说,根据以前的经验,我们首先会从西瓜这个具体的事物中抽取一些有用的信息,比如西瓜的颜色、瓜蒂的形状、敲击的声音等,然后根据一定的规则在这些信息的基础上进行判断————一般情况下我们认为颜色青绿、根蒂蜷缩…
泰坦尼克号任务-载入、观察、探索性分析
数据载入及初步观察,探索性分析 载入和观察 相对路径和绝对路径 查看当前工作目录使用os.getcwd(),改变当前工作目录os.chdir(路径),获得当前目录的绝对路径命令os.path.abspath('.')相对路径就是在当前工作目录下的文件,可以直接打开data = pd.read_csv('train.csv')绝对路径就是可以使用任何…
数据分析之MySQL学习
数据分析之MySQL学习 参考课程:戴师兄数据分析 原始幕布格式笔记:戴师兄数据分析启蒙课:SQL基础语法+运行原理+云端数据库搭建.opml,提取码: jb27 基础语法 语法结构:select--from--where--group by--having--order by--limit 运行顺序:from--where--group by--…
数据分析之Excel学习—大厂周报制作
一、常用函数 sum函数日期组合date(year(),month(),day()),用来计算环比,同比的日期。日期本质是数字,可以加减操作!sumifs函数,有条件的求和,也可以理解为筛选一些特定字段对应的数值之和!vlookup函数,根据字段匹配相应内容match函数 定位内容所在位置index函数,根据位置提取内容 二、周报表实例操作记录 制…
pandas基础学习
import pandas as pd data1 = [1,2,3,4,5] s = pd.Series(data1) s 0 1 1 2 2 3 3 4 4 5 dtype: int64 s2 = pd.Series(data1,index = ['a','b','d','g','f']) s2 #自定义索引 a 1 b 2 d 3 g 4 f…
numpy基础练习
import numpy as np #导入 numpy 包 data1 = [1,2,3,4,5] array1 = np.array(data1) array1 array([1, 2, 3, 4, 5]) data2 = [[1,3,5],[2,4,6]] array2 = np.array(data2) array2 array([[1, …