草庐IT

采集数据实验

余音23 2023-10-22 原文

今天下午采集数据实验,利用八爪鱼和后裔采集器采集电影评论,商品评论,政府网站,企业股东的信息之类的。

我们宿舍同学都是从下午两点一直到现在一直坐在电脑跟前,中间除了吃饭和去厕所就没咋离开电脑。

刚开始用这两个软件不太熟悉,进度比较慢,后来慢慢熟悉了操作也快了起来。整个过程一开始很急躁,因为数据没采集出来,试了很多次都是错误。后来一遍一遍的对照老师发的操作视频才发现自己做的时候太慌了,没有注意到步骤之间细微的差别,所以数据采集不出来。

这时候突然想到了这样一句话,慢慢来,比较快。

我在跟着视频操作时总想着快点进行,快进看操作步骤。表面上看和操作视频大差不差,但是最后结果出不来,我就要从头开始一步一步的再进行,从新开始的时候我自以为自己已经熟悉操作了,就也不看操作视频了,凭着自己的记忆操作,结果还是出不来。

我问室友有没有遇到这样的问题,她说没有,她就是按照视频操作的一次就成功了。这时另一个室友说也遇到了和我一样的问题,我感觉很奇怪,总感觉自己的操作也没错呀,室友也和自己有一样的问题。后来我就先做下一个了,过了一会儿室友说她发现问题的原因了,是有两个地方的参数没有设置,设置完之后就可以出结果。

我这下明白过来,还是自己没有仔细看操作视频,没有注意到细微的差别。导致比别人多返工了3,4次。

而这本可以一步到位的事情,我却因自己的疏忽多走了弯路。

有关采集数据实验的更多相关文章

  1. 阿里云大数据实战记录4:生产环境添加列 - 2

    生产环境添加列的方法通过代码新增列添加列的时候,要注意引擎类型,可以根据以下操作查看引擎类型。如果有权限查看配置相关内容,也可以点配置里查看。(目前我没有该权限,也不知道都有什么内容~~)为什么要注意引擎类型呢?因为不同的引擎,意味着不同的配置,对应的语法也是不同的,比如mysql的引擎和maxcomputer的引擎新增列的操作不同,下面找了两个文档可供参考云原生数据仓库AnalyticDBMySQL版-增加列云原生大数据计算服务MaxCompute-增加列具体语法和例子如下:--MaxComputer新增列altertabletable_name>addcolumns(col_name1>t

  2. php - 在流程之前验证集数据时,我应该使用哪个 SPL 异常? - 2

    我正在努力思考何时使用两个PHPSPLExceptions,具体在以下场景中,classMyClass{protected$data1;protected$data2;publicfunctionsetData1($data1){$this->data1=$data1;}publicfunctionsetData2($data2){$this->data2=$data2;}publicfunctioninvokeProcess(){$this->validateData();}protectedfunctionvalidateData(){if(!$this->data1){//Whi

  3. c++ - 如何将位集数据写入文件? - 2

    这个问题在这里已经有了答案:Howdoesonestoreavectororabitsetintoafile,butbit-wise?(7个答案)关闭6年前。我有一个std::bitset,我想一点一点地写入文件,但是fstream的写入函数当然不支持这个。除了使用字符串将每个8位组转换为char并编写它之外,我想不出其他方法...谁知道什么好方法?

  4. iphone - 用核心数据实现 "Did you mean?" - 2

    我正在开发iOS应用程序。我有一个包含很多公司名称的CoreData数据库。当用户输入不存在的公司名称时,我想显示“相似”的公司名称。例如,如果用户输入“Aple”,我想显示“DidyoumeanApple?”。我知道找到与模式近似(而不是完全)匹配的字符串的技术称为近似字符串匹配,或者通俗地说,模糊字符串搜索.理论上,有很多算法,或多或少是有效的:Levenshtein距离计算算法等等。但在实践中,是否有人已经实现了可以轻松与核心数据一起使用的类似东西? 最佳答案 我找到了一个解决方案。使用GitHub上可用的NSString类别

  5. ios - 如何从核心数据实体中读取 NSArray - 2

    我正在尝试将一个核心数据实体读入NSMutableArray,但是我一直在取回大量奇怪的数据。例如,当我取回值的NSDictionary时,它看起来像这样data:{companyName="WPremium";desc="Test";guid="Otq12342";install=("0x1e59e910","0x1e59e8e0","0x1e59e830","0x1e59e930","0x1e59e850","0x1e59e890","0x1e59e8b0","0x1e59e7c0","0x1e5957e0","0x1e59e810","(...and16more...)");我想

  6. ios - Xcode UI 不显示我创建的核心数据实体 - 2

    XcodeCoreDataUI不显示我在图形View中创建的实体。为什么是这样?我该如何解决? 最佳答案 图形编辑器即使在最好的时候也很古怪。经常重新启动Xcode可以解决此问题。从表格样式切换到图形样式会强制重绘。关闭文件(不是项目,只是模型文件)并重新打开它也可以清除它。如果这些都不起作用,那么您的Xcode项目中可能有损坏的xcshareddata文件。尝试在Xcode未运行时删除该文件(或将其重命名以进行测试),然后启动Xcode并强制其重建它。 关于ios-XcodeUI不显示

  7. iOS/核心数据实体与预定义数据的关系 - 2

    我有两个Objective-C核心数据实体-比如Person和Nationality。Person将与Nationality建立一对一关系,而Nationality将与Person建立一对多关系。此外,Person类可以有任意数量的对象/行,而Nationality将有一个包含200个奇数实例的预定义列表。因此除了这200个对象之外,Person不应该能够为自己分配国籍。有人可以建议我们如何编码,或者如果有可用的示例代码?恐怕我似乎无法开始了解如何利用setValue:forKey:here...非常感谢! 最佳答案 假设您的国籍实

  8. ios - 如何在核心数据实体中声明一个 transient 变量 - 2

    我有一个名为Recipient的核心数据实体。我需要根据收件人姓名的第一个字符对收件人进行分组。我正在使用fetechedresultsController。我需要一个属性,我可以将其提供给NSFetchedResultsController以将其用作节键。此属性不需要保存在coredata中。所以我想创建一个Transient属性并为该属性提供我自己的setter和getter实现。应用程序崩溃说在收件人实体中找不到此类属性。请帮忙。在Recipient.h中我有@interfaceRecipient:NSManagedObject@property(nonatomic,retain

  9. ios - 如何设置核心数据实体对象的关系 - 2

    我有一个实体mainEntity,它与三个不同的实体entity1、entity2和entity3具有三个一对多关系(关系以它们所指的对象命名)。entitymainEntityattributenamerelationentity1relationentity2relationentity3这三个实体与这个mainEntity是一对多的反向关系(都一样,这里以first为例)。entityentity1attributenamerelationmainEntity总的来说,它是来自一个mainEntity的三个多对多关系。现在我需要将mainEntity的三个关系设置为object1

  10. ios - 编辑/添加具有相同 View 的核心数据实体? - 2

    首先,让我解释一下我要完成的任务。我有一个带有MasterViewController和EditViewController的主从应用程序。MasterViewController包含一个添加按钮和一个列出核心数据实体的表。当用户点击表行或添加按钮时,应弹出编辑View。我对如何以不同方式处理编辑和添加感到困惑。这是我目前的做法:我的应用程序使用Storyboard,所以我有editEntity和addEntity从Master到Edit的segues。两个segue都将一个实体传递给EditViewController,但editEntity根据点击的行找到一个现有实体,而addEn

随机推荐