编程技术分享
未读
R与SAS比较四舍五入的差异及浮点数的特性
从Dataset-JSON v1.1 User's Guide中,提到两个和R相关的值得注意的细节:SAS与R的四舍五入差异和R中浮点数的特性,这可能是用R进行数据处理无法回避的两个细节,本篇文章是对这两篇文章的解读和学习,文章地址在文末。 R与SAS在四舍五入函数的差别及解决办法 在SAS里使用r
编程技术分享
未读
创新药股票数据Shiny可视化面板实践
探索方向 回顾了 R 语言的基操之后,我决定构建一个能够自动更新数据的 Shiny 可视化面板用于追踪和展示创新药相关股票的市场表现。本次尝试有两方面原因: 首先,股票数据具有天然的时效性和动态更新需求,非常适合用来探索 Shiny 应用中数据自动刷新的机制; 其次,今年创新药概念板块的股票涨势良好
编程技术分享
未读
<R语言数据高效处理指南>-4-Rdatatable
什么是data.table Matt Dowle以及其他作者写的一个数据处理包,目的是追求high-performance数据处理,和dplyr相比,data.table速度更快、导入数据和处理数据的速度都更快,但写法没有那么简洁、易写易懂。
编程技术分享
未读
<R语言数据高效处理指南>-3-Tidyverse
出自Hadley Wickham之手的多个R包合集,包含了dplyr、ggplot2等使用R语言编程必接触的一些包,能够做到从数据预处理到高级转换、可视化、建模展示等数据科学整套流程。tidy是简洁的意思,verse是诗篇的意思,寓意简洁的像诗一样。在用tidyverse包编程的时候,可以使用管道符
编程技术分享
未读
<R语言数据高效处理指南>-2-Base-R
R语言在不需要加载任何包的情况下,内置了很多语句可以进行数据集处理,这种处理也叫做Base r语句,下面是Base r语句在数据处理基本范式中的应用。 rm(list = ls()) 数据集基本探索,str, summary, head str(iris)
summary(iris)
head(ir
编程技术分享
未读
<R语言数据高效处理指南>-1-R语言基础
有段时间没用R了,最近打算回顾一下黄天元大佬写的《R语言数据高效处理指南》,把其中处理数据常用的地方温习一下、结合自己的思考做做笔记。 出于版权保护的考虑,书里更加精彩的部分如数据可视化、文本挖掘、爬虫和机器学习的部分就不放在这里了。 另外在这里发一下黄天元老师的微信公众号,他目前知乎刷的飞起,希望