编程技术分享
未读
<R语言数据高效处理指南>-4-Rdatatable
什么是data.table Matt Dowle以及其他作者写的一个数据处理包,目的是追求high-performance数据处理,和dplyr相比,data.table速度更快、导入数据和处理数据的速度都更快,但写法没有那么简洁、易写易懂。
编程技术分享
未读
<R语言数据高效处理指南>-3-Tidyverse
出自Hadley Wickham之手的多个R包合集,包含了dplyr、ggplot2等使用R语言编程必接触的一些包,能够做到从数据预处理到高级转换、可视化、建模展示等数据科学整套流程。tidy是简洁的意思,verse是诗篇的意思,寓意简洁的像诗一样。在用tidyverse包编程的时候,可以使用管道符
编程技术分享
未读
<R语言数据高效处理指南>-2-Base-R
R语言在不需要加载任何包的情况下,内置了很多语句可以进行数据集处理,这种处理也叫做Base r语句,下面是Base r语句在数据处理基本范式中的应用。 rm(list = ls()) 数据集基本探索,str, summary, head str(iris)
summary(iris)
head(ir
编程技术分享
未读
<R语言数据高效处理指南>-1-R语言基础
有段时间没用R了,最近打算回顾一下黄天元大佬写的《R语言数据高效处理指南》,把其中处理数据常用的地方温习一下、结合自己的思考做做笔记。 出于版权保护的考虑,书里更加精彩的部分如数据可视化、文本挖掘、爬虫和机器学习的部分就不放在这里了。 另外在这里发一下黄天元老师的微信公众号,他目前知乎刷的飞起,希望