鼠小米-CSDN博客

文章目录Numpy基本属性Numpy 创建数组（array）Numpy计算Numpy索引Numpy数组（array）合并Numpy array 分割Numpy复制Numpy基本属性import numpy as np#list列表转化为矩阵arr1 = np.array([[1,1,1],[2,2,2],[3,3,3]],dtype=np.int)print('矩阵维度:',arr1.ndim)print('矩阵行和列数:',arr1.shape)print('矩阵元素个数:',arr1.si

2021-09-02 19:32:37 377 1

原创 pandas数据处理大全（必备）

panda基本操作pandas读取文件import pandas as pd'''读取txt文件为dataframe'''df1 = pd.read_csv("./read.txt")'''读取csv文件为dataframe'''df2 = pd.read_csv('./read.csv')#在读数之后自定义标题df3 = pd.read_csv('./read.csv',header=None)df3.columns=['列1','列2','列3','列4']#读取csv文件中每行

2021-09-02 12:18:54 1275

原创 pandas存储数据到excel

#-*- coding:utf-8 -*-import pandas as pdfrom collections import OrderedDict#传入一个二维列表def save_excel(excel_name,header,data): obj = pd.DataFrame(data) obj.to_excel(excel_writer=excel_name,index=True,header=header) print('保存成功') excel_na

2021-09-01 19:34:44 1249

原创 sklearn进行机器学习 ( 一天掌握 )

目录文章目录目录机器学习特征工程特征抽取skearn数据集使用字典特征提取文本特征抽取中文文本特征抽取中文分词中文文本特征抽取-自动分词TF-IDF特征预处理归一化标准化（大数据用）特征降维特征选择主成分分析-PCA降维分类算法K-近临算法（KNN算法）模型选择与调优facebook案例朴素贝叶斯算法20类新闻分类决策树决策树对鸢尾花数据分类泰坦尼克号乘客生存预测随机森林随机森林对泰坦尼克号乘客的生存进行预测回归与聚类算法线性回归波士顿房价预测欠拟合与过拟合线性回归的改进-岭回归带有L2正则化的线性回归-

2021-08-30 18:22:59 468 1

原创数据库（速成快速搞定面试和笔试）

文章目录基本概念相关概念面试常问笔试常考测试基本概念概念解释Data数据，是数据库中存储的基本对象，是描述事物的符号记录Database数据库，长期存储在计算机内、有组织、可共享的大量的数据的集合。数据库中的数据按照一定的数据模型组织、描述和存储，具有较小的冗余度、较高的数据独立性和易扩展性，并可为各种用户共享。特点：永久存储、有组织、可共享DBMS位于用户与操作系统之间的一层数据管理软件。主要功能：数据定义功能（DDL）；数据组织、存储和管理；数据操纵功能（DML

2021-08-23 19:29:19 277 2

原创 python3 re正则表达式(极速掌握)

python3 re正则表达式常用的元字符代码说明 . 匹配除换行符（\n）以外的任意字符 ^ 匹配字符串的开头 $ 匹配字符串的末尾 \w 匹配字母或数字或下划线或汉字0-9、a-z、A-Z、_（下划线）、汉字和其他国家的语言符号 \W 匹配非字母或数字或下划线或汉字，跟\w正好相反

2021-08-16 21:29:08 439 1

原创 seleniumv保持登录状态

seleniumv保持登录状态from selenium.webdriver import Chrome,ChromeOptions #引入selenium中的Chrome#实例化谷歌设置选项option = ChromeOptions()#添加保持登录的数据路径：安装目录一般在C:\Users\黄\AppData\Local\Google\Chrome\User Dataoption.add_argument(r'user-data-dir=C:\Users\xxxx\AppData

2021-07-14 23:19:06 1595 1

原创输出指定范围内所有的完数

题目：一个数如果恰好等于它的因子之和，这个数就称为"完数"。例如6=1＋2＋3.编程找出指定范围内的所有完数。#!/usr/bin/python# -*- coding: UTF-8 -*-from sys import stdoutstart=2end=28for j in range(start, end+1): k = [] n = -1 s = j for i in range(1, j): if j % i == 0:

2021-05-06 21:08:46 593

原创旅行必备（出行必备）

旅行必备1、证件类身份证学生证驾照护照现金银行卡车票或机票疫苗接种证证件照2、衣物类小书包行李箱衣服鞋子拖鞋泳装太阳镜帽子围巾口罩内裤袜子 3、个人洗护类护肤品洗面奶毛巾牙刷牙膏牙刷眼镜洗发水沐浴露压线4、电子类及其他小物品手机平板电脑充电器充电宝耳机相机雨伞梳子小镜子水杯手纸创可贴行程单零食5、常用药品

2021-04-28 23:52:48 192 1

原创分层多标签文本分类：一种基于注意的递归网络方法

分层多标签文本分类：一种基于注意的递归网络方法

2021-03-15 09:05:45 692

原创概率论中各种分布

概述连续概率分布函数(也称为概率密度函数（probability density function）)离散概率分布函数(也称为概率质量函数（probability mass function）)分布介绍

2021-01-17 17:10:03 743 1

原创 csdn格式字体、样式、排版

字体颜色和大小1、设置颜色的两种形式<font color=#00FF7F size=3 >字体的颜色和大小</font> # 16进制表示法<font color=blue size=3 >字体的颜色和大小</font> # 单词表示法16进制表示法单词表示法常用颜色浅红色文字：#dd0000深红色文字：#660000浅绿色文字：#00dd00深绿色文字：#006600浅蓝色文字：#0000dd深蓝色文字：#

2021-01-16 12:14:53 374 1

原创 Windows新电脑配置及问题百科

Pycharm基本配置 Ctrl+鼠标滚轮改变字体大小换个舒适的主题编码设置utf-8 解释器设置关闭Pycharm自动更新设置代码提示忽略大小写设置自动导包python开发用到的包 pip install pymc3 ，安装好pymc3之后要下numpy-mkl重新安装numpy pip install selenium，Chrome浏览器需要安装chromedriver pip install requests，爬虫包Anacond

2020-12-15 16:18:32 147

原创 Ubuntu新电脑配置及问题百科

新电脑操作通过“软件更新程序”更新设置Dock，我喜欢在下方，在终端执行gsettings set org.gnome.shell.extensions.dash-to-dock click-action 'minimize'可以启用图标点击最小化功能。换源，我用的清华源，更新软件。换显卡驱动，不然总会遇到卡死的情况添加ubuntu自带的截图功能进入设置->设备->键盘在截图那一选项里，选择将选区截图保存到图片目录，并设置为 Ctrl + Alt + A 修改roo

2020-11-30 20:07:37 98

转载 LaTex安装及使用

LaTex安装简介：LaTeX是一种基于TeX的排版系统，由美国电脑学家莱斯利·兰伯特在20世纪80年代初期开发，利用这种格式，用户能在几天，甚至几小时内生成很多具有书籍质量的印刷品。因此它非常适用于生成高印刷质量的科技和数学类文档。一、文件下载1.TeXLive通过官网下载会比较慢，这里推荐通过清华大学开源软件镜像站进行下载，下载链接可点击此处，然后选择 texlive2018.iso 下载即可2.texlive2018.iso下载完毕后，如果系统有DVD驱动器则双击打开ISO镜像即可（如果

2020-10-28 16:21:09 3485 2

原创 Graphviz Windows安装及使用

安装流程1.官网下载官网下载地址：graphviz-2.3.8.msi2.下载之后，进行安装。找到安装路径，如：F:\python-chajian_or_package\Graphviz3.将其中bin文件夹对应的路径添加到path环境变量中，也就是将F:\python-chajian_or_package\Graphviz\bin添加到path环境变量中。3.cmd 运行 pip install graphviz4.测试cmd运行 dot -version使用教程例1:pymc3中用

2020-10-27 16:37:10 713

原创 selenium爬取巨潮资讯指定领域下所有上市公司的数据并存储到csv文件

selenium爬取巨潮资讯指定领域下所有上市公司的数据from selenium.webdriver import Chrome #引入selenium中的Chromefrom selenium.webdriver.common.keys import Keys #引入键盘import time #时间模块import osimport csvdata_index=1data=[1,2,3,4,5]temp_index1=1temp_index2=

2020-10-27 15:26:46 405

转载 pyltp进行词性标注

python版本：3.6pyltp简介pyltp 是 LTP 的 Python 封装，提供了分词，词性标注，命名实体识别，依存句法分析，语义角色标注的功能。pyltp 安装步骤第一步，下载Visual C++ 2015并装第二步，下载pyltp所需的whl文件和完整的 LTP 模型文件注：请确保下载的模型版本与当前版本的 pyltp 对应，否则会导致程序无法正确加载模型。第三步，进入文件下载目录pip install [文件名]whl模型文件放置（1）新建一个文件夹，如D:..

2020-10-11 18:56:24 1379

原创 selenium分类爬取谷粉专利数据

方法：利用selenium模仿人点击页面，爬取需要的数据源代码from selenium import webdriverimport osimport timepage_index1=1page_path_new=""time_temp = 10i_index=['H01','H02','H04','G06']def pang_page(page_path,i1): searchResultItems=browser.find_elements_by_xpath('//*[@.

2020-09-27 18:43:14 294 1

原创巧用selenium爬取巨潮资讯公司数据

巧用selenium爬取巨潮资讯公司数据立项背景：在做深度学习的过程中利用python进行建模，需要数据来训练模型。项目目标：通过运用python的selenium模块，爬取巨潮资讯网站关于公司的数据并存储到csv文件。项目流程图源码from selenium.webdriver import Chrome #引入selenium中的Chromefrom selenium.webdriver.common.keys import Keys #引入键盘impor

2020-09-22 16:18:16 1388 1

原创爬取巨潮资讯制造业公司年报数据

import requestsimport randomimport timeimport sysimport ossys.path.append('../')download_path= 'http://www.cninfo.com.cn/new/index'saving_path= 'E://2019年报sz'User_Agent= ["Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Win64; x64; Trident/5.

2020-09-12 21:35:52 2216 8

原创断点继续下载模块

import sysimport requestsimport osimport time# 屏蔽warning信息requests.packages.urllib3.disable_warnings()headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/79.0.3945.130 Safari/537.36"}

2020-09-12 21:33:07 80

原创 python利用selenium爬取图片信息

python利用selenium爬取图片信息项目目标：通过运用python爬虫技术，模仿人为操作，克服反爬机制，爬取想要得到的信息项目流程图taob_view.pyfrom selenium.webdriver import Chrome #引入selenium中的Chromefrom selenium.webdriver.common.keys import Keys #引入键盘import time #时间模块import requests

2020-06-07 20:25:33 1181 4

转载数据结构核心-八大排序算法

数据结构核心-八大排序算法原文：http://blog.csdn.net/u010850027/article/details/49362279 排序是数据处理中一种很重要也很常用的运算，一般情况下，排序操作在数据处理过程中要花费许多时间，为了提高计算机的运行效率，我们提出并不断改进各种各样的排序算法，这些算法也从不同角度展示了算法设计的重要原则和技巧。在小编的

2020-05-10 11:40:07 285

转载 Python 中的Sympy详细使用

Python 中的Sympy详细使用遇到复...

2020-05-08 12:44:38 1305

原创【学习笔记】概率论与数理统计 - 陈希孺--第一章.事件的概率

【学习笔记】概率论与数理统计 - 陈希孺–第一章具体内容请参考原著，本文仅作个人学习记录。基本概念蕴含、包含及相等A包含B是指A里面有B，B是A的子集，B在A的范围内。也就是B包含于A。A包含于B是指B里面有A，A是B的子集，A在B的范围内。也就是B包含A。蕴含表示 A发生从而B一定发生，也就是A⊂B（也称B包含A或A包含于B），如果A⊂B 且B⊂A，则说明A=B事件的互斥和...

2020-04-13 13:08:05 1255 1

原创大数据&人工智能学习路线（小白都可以看懂-从入门到精通）

大数据&人工智能学习路线先来看一个大数据网站所需用到的技术图学习技术Linux：大数据基础，hadoop、hive、hbase、spark等大数据软件的运行环境和网络环境配置，通常都是搭建在Linux操作系统之上。Hadoop：Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。Hadoop是一个数据管理系统...

2020-04-08 10:42:13 1983 2

原创【机器学习】学习成长路线图（初学者到专业科学家必备）

机器学习–学习成长路线图学习流程图入门方向与进阶方向路线1：机器学习算法工程师路线2：数据科学家路线3：异构并行计算工程师路线4：语音识别工程师路线5：计算机视觉工程师路线6：自然语言处理工程师路线7：知识图谱工程师路线8：推荐系统工程师路线9：对话系统系统工程师路线10：自动驾驶工程师参考路线Step0：准备阶段 1....

2020-04-08 09:20:20 1742

原创概率图模型（快速入门必备）

概率图模型是用图来表示变量概率依赖关系的理论，结合概率论与图论的知识，利用图来表示与模型有关的变量的联合概率分布。由图灵奖获得者Pearl开发出来。概率图模型理论分为概率图模型表示理论，概率图模型推理理论和概率图模型学习理论。近10年它已成为不确定性推理的研究热点，在人工智能、机器学习和计算机视觉等领域有广阔的应用前景。

2020-04-06 10:46:12 2828 1

原创十分钟配置你的专属idea

十分钟配置你的专属idea（idea是JAVA开发利器）idea相对于Eclipse的优点：强大的整合能力：比如Git、Maven、Spring等支持。。。提示功能的快速、便捷。提示功能的范围比较广。好用的快捷键和代码模板精准搜索首先呢，是对idea的一个安装：参考文章：IDEA安装和使用这里我着重说一下，idea安装完成后怎样配置使我们使用起来更高效1.关闭Intel...

2020-03-28 13:08:05 442

原创 python环境与pycharm工具安装

python环境与pycharm工具安装安装1.到官网下载python和pycharmpython官网:https://www.python.org/getit/pycharm官网:https://pycharm.en.softonic.com/2.建立文件夹建立一个python文件夹在python文件夹下建立3个子文件夹命名为：pycharmev，pythonev,pyt...

2020-03-25 21:39:59 386

转载基于python的招聘网站分析

基于python的招聘网站分析立项背景：通过使用招聘网站的体验，发现对现在IT市场主流人才和技术需求缺乏宏观的掌握。项目目标：通过运用python爬虫技术，爬取大型主流招聘网站关于大数据人才的需求，并通过后台分析，最终以玫瑰图，漏斗图，地图的形式展示当下市场主要需求。项目流程图51job_view.pyimport urllib.requestimport xlwt ...

2020-01-09 15:59:47 4137 4

sinat_39616953的博客

原创大学课堂点名程序

原创 Numpy数据处理（全面）