首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >R中的分词数据

R中的分词数据
EN

Stack Overflow用户
提问于 2013-07-09 22:49:53
回答 1查看 1.7K关注 0票数 2

我正在尝试创建一个函数,它根据给定的向量确定某个值进入哪个存储桶中。所以我的函数有两个输入:一个确定存储桶断点的向量(例如:如果向量是(1,4,5,10),那么存储桶将是<=1,110)和一个特定的数字。我希望函数输出一个确定存储桶的特定值。例如,如果我输入.9,输出可能是1,1.6,输出可能是4,5.8,输出可能是10,13,输出可能是"10+“。

我现在这样做的方法是,首先检查输入的数字是大于向量的最大元素还是小于向量的最小元素。如果不是,我就运行for循环(不知道如何使用apply)来检查这个数字是否在每个特定的时间间隔内。问题是这太低效了,因为我要处理的数据集太大了。有没有人知道做这件事的有效方法?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2013-07-09 22:54:01

使用cut()函数可以方便地使用:cut(splitme,breaks=vectorwithsplits)

但是,看起来您实际上是在尝试找出一个插入点。你需要像binary search这样的东西。

票数 4
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/17551371

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档