草庐IT

algorithm

全部标签

c# - 比较内存中的 2 个无序记录集

下面是我的应用程序数据库表,其中包含存储在表中的SQL查询:QueryStorageIdQueryConnectionStringRdbms1select...DataSourceSqlServer2select...DataSourceOracle上表中的SQL查询是通过网络服务更新的,我们不允许在查询之上更新,尽管我们可以在查询之上添加一些东西,如下所示:查询存储在表中:从源中选择id作为LinkedColumn,Amount作为CompareColumn从我的c#应用程序调整查询:从(存储的sql查询)中选择Q.LinkedColumn、Q.CompareColumn作为Q我正在

c# - 在二维网格中查找所有循环/封闭形状

我有一个“无限”二维网格,我想检测封闭/完整的“结构”——任何形状的区域,这些区域被四面包围。但是,我需要识别每个单独的闭合电路-包括较大的形状(如果有的话)。在研究这个过程中,我发现了循环检测算法,但我没有看到一种干净/有效的方法来将较大的电路与较小的电路分开。例如给定以下两个“完整”结构:01110010100111000000011111010101011111第一个是由8个“墙”包围的单个单元格。循环检测使得检测这一点变得微不足道。第二个示例包含示例一个的两个副本,但它们共用一堵墙。我关心的是三个独立的电路-左室、右室和整体结构。循环算法的多次通过可能有效,但我必须确保我没有回

c# - 实现平衡二叉搜索树?

按照目前的情况,这个问题不适合我们的问答形式。我们希望答案得到事实、引用或专业知识的支持,但这个问题可能会引发辩论、争论、投票或扩展讨论。如果您觉得这个问题可以改进并可能重新打开,visitthehelpcenter指导。关闭9年前。我已经实现了一个二叉搜索树,我想在它的插入函数中添加更多的功能,使它成为一个自平衡树。我正在用C#编写代码。任何人都可以给我推荐好的教程或链接吗?我进行了一些搜索并找到了一些链接,但没有一个具有足够的描述性。谢谢。

c# - 网络爬虫数据存储在哪里?

我有一个简单的网络爬虫,它从根目录(给定的url)开始下载根页面的html,然后扫描超链接并爬取它们。我目前将html页面存储在SQL数据库中。我目前面临两个问题:爬虫好像遇到了瓶颈,没法爬得更快,我在某处读到,对页面进行多线程http请求可以让爬虫爬得更快,但我不确定如何做到这一点。第二个问题,我需要一个高效的数据结构来存储html页面并能够对其进行数据挖掘操​​作(目前正在使用SQL数据库,希望听到其他建议)我正在使用.Net框架、C#和MSSQL 最佳答案 所以首先,我不会担心进入分布式爬虫和存储,因为顾名思义:它需要相当数量

C# 查找相关文档片段用于搜索结果显示

在为我正在构建的站点开发搜索时,我决定采用廉价且快速的方式并使用MicrosoftSqlServer的全文搜索引擎,而不是像Lucene.Net这样更强大的引擎。不过,我希望拥有的功能之一是google-esque相关文档片段。我很快发现确定“相关”片段比我意识到的要困难。我想根据找到的文本中的搜索词密度来选择片段。因此,从本质上讲,我需要在文本中找到搜索词最多的密集段落。一段是任意数量的字符(比如200——但这并不重要)。我的第一个想法是在循环中使用.IndexOf()并构建一个术语距离数组(从先前找到的术语中减去找到的术语的索引),然后......什么?将任意两个、任意三个、任意四

c# - 流行网站帖子的流行度衰减算法

我正在寻找一种算法来按受欢迎程度对网站结果进行排序。就像Reddit一样,帖子越旧,其投票/分数的影响力就越小。这是reddit使用的普遍接受的解决方案:t=(timeofentrypost)-(Dec8,2005)x=upvotes-downvotesy={1ifx>0,0ifx=0,-1ifx我已经研究过Reddit的算法,虽然它适用于一种情况,但我真正需要的是两种算法,一种用于热门帖子,另一种用于即将发布的帖子:热门帖子即将发布的帖子受欢迎度会衰减得更慢,对稍旧的帖子给予更多权重,而即将发布的帖子将更多地关注今天的热门帖子,在N小时/天/等后急剧下降。我正在使用Sphinx表达式

c# - 如何搭建一个简单的推荐系统?

如何搭建一个简单的推荐系统?我见过一些算法,但实现起来非常困难,我希望它们是实现最简单算法的实用描述?我有这三张表Usersuseridusername1aaa2bbb和productsproductidproductname1laptop2mobilephone3car和users_productsuseridproductid11133223所以我希望能够根据他们购买的商品和其他用户的商品为每个用户推荐商品我知道它应该像计算用户之间的相似性,然后查看他们的产品,但是如何完成并存储在数据库中,因为这将需要一个包含类似内容的表123456那么如何计算用户之间的相似度呢?以及如何将这些复

c# - 在 C# 中计算 Cron 下一次运行时间

我有类似crontab的调度程序。时间定义“MMHHWDMDM”:MM-分钟HH-小时WD-星期几MD-一个月中的几天M-月WD,MD,M允许多个条目,每个参数可以为空,例如:^^0,1^^meansexucutioneveryminute,everyhour,atsundayandmondey,everyday3515^^^executioneverydayat15.35问题是如果知道上次执行日期,如何计算下一次运行时间。我知道如何使用循环执行此操作(只需添加1分钟直到它符合条件),但必须有更好的方法。 最佳答案 我已经成功使用了

c# - 在 C# 中计算整数 log2 的最快方法是什么?

如何最有效地计算C#中整数(对数基数2)所需的位数?例如:intbits=1+log2(100);=>bits==7 最佳答案 轻微对Guffa答案的改进...由于您添加到结果中的数量始终是2的幂,因此使用位操作可以在某些体系结构上产生轻微的改进。此外,由于我们的上下文是位模式,因此使用十六进制更易读。在这种情况下,将算术移动2的幂是有用的。intbits=0;if(n>0xffff){n>>=16;bits=0x10;}if(n>0xff){n>>=8;bits|=0x8;}if(n>0xf){n>>=4;bits|=0x4;}i

c# - 有没有一种使用正则表达式解析大文件的快速方法?

问题:非常非常大的文件,我需要逐行解析以从每行中获取3个值。一切正常,但解析整个文件需要很长时间。有可能在几秒钟内完成吗?通常需要1到2分钟。示例文件大小为148,208KB我正在使用正则表达式来解析每一行:这是我的C#代码:privatestaticvoidReadTheLines(intmax,Responderrp,stringinputFile){Listrate=newList();doublecounter=1;try{using(varsr=newStreamReader(inputFile,Encoding.UTF8,true,1024)){stringline;Con