草庐IT

Algorithm

全部标签

java - Collections.sort() 和通过添加到 TreeSet 中获取排序集合之间的区别?

Setts=newTreeSet();for(Students:studentInfo){ts.add(s);}System.out.println(ts);为了对一组学生对象进行排序,我在我的一个案例block中编写了上面的代码片段。我的问题是:使用这种方法和使用Collections.sort();方法有什么区别。 最佳答案 不同之处在于,TreeSet让您始终对数据进行排序,而Collections.sort()方法会在您调用上的方法时对数据进行排序设置。Collections.sort()的时间复杂度是O(n*log(n))

php - 从链接中查找页面的技术

我计划编写一个很棒的SEO工具,我想知道如何从静态/动态网站链接中找到页面。我将只拥有像www.yahoo.com这样的域,我的系统应该找到该主机中存在的所有页面。有什么技巧可以做到这一点吗?我可以使用任何语言,但我认为.NET会真正插入事情的发展。 最佳答案 我认为您几乎肯定必须解析页面代码以获取对HREF=的引用您可以使用System.WebRequest.Create(uri)请求URL,然后通过响应流使用Regex。如果.Net中有更简单的方法,我当然会感兴趣。 关于php-从链

javascript - 我如何提出评级算法/方程式?

我正在尝试提出一个评级算法-所以它会做的是,从用户拥有的一组关键字(用于SEO)中,为每个关键字提供1-10之间的评级(10是最好的机会来自该集合)-将通过比较关键字具有的“搜索量”与“关键字难度”来得出评级-here是截至目前带有虚拟数据的评级列的屏幕截图,但会给您一个想法;所以本质上这将帮助用户做的是从用户当前拥有的所有关键字集中找出哪个关键字是最好的关键字例如有人已经在另一个分割市场(航类搜索)中做类似的事情(从一组选择中进行评级算法)是momondo,请在momondo上进行随机航类搜索。com,你会看到它带有一个rating通过比较价格和平均飞行时间。上面给出的所有内容,想知

algorithm - 谷歌算法的文件结构

我对谷歌算法的文件结构有疑问。与在htaccess文件中使用重写规则相比,为您的站点使用物理文件结构会有所不同吗?谷歌会知道区别吗?比如public_html/index.phpabout/index.phpother/index.php或者使用重写规则将文件名更改为目录public_html/index.phpabout.phpother.php我对htaccess的东西不是很好,但我认为脚本可以吗?RewriteEngineOnRewriteCond%{SCRIPT_FILENAME}!-dRewriteCond%{SCRIPT_FILENAME}!-fRewriteRule^(\

algorithm - 从给定文本生成关键字的最佳方法是什么?

我想为我的CMS生成关键字。有人知道生成关键字的好PHP脚本(或其他脚本)吗?我有一个这样的HTML站点:http://pastebin.com/ZU8vdyeP 最佳答案 这是计算机很难解决的问题。让某人(其他人?)手动执行或根本不执行会容易得多。如果你真的需要一台电脑来做这件事,我会去优秀的Python库NLTK它有许多用于此类事情的工具(=自然语言处理),并且使用起来很有趣。例如,您可以计算单词的频率分布,然后搜索出现频率最高的较大(超过5个字符)单词的最常见上位词,并将其用作关键字可能的提示。不过,人工完成要容易得多。

c# - 在字符串中查找重复内容?

你会如何解决以下问题:我有一个带有文本的半大文件(大约10页),我想在这段文本中找到重复的内容。更具体地说,给定一个字符串,找到两个最长的相同字符串。我一直在看最长的公共(public)子序列:http://en.wikibooks.org/wiki/Algorithm_implementation/Strings/Longest_common_subsequence但是这些实现将两个字符串作为输入。也许已经有服务在做这件事? 最佳答案 这是一个简单(但效率低下)的算法:循环所有可能的子串长度,从最大值到1。对于每个长度,将所有该长

algorithm - 谷歌抓取索引算法

我正在寻找一些关于Google如何抓取和索引内容的文档。我阅读了许多关于如何提高排名和确保内容被正确编入索引的“简单”论文和文章,但我正在寻找一些关于Google如何抓取和索引内容的更高级的技术文档。我想了解更多的事情:Google在抓取时寻找哪些元素:页面内容、URL格式、关键字、描述等...索引是如何更新的?基本上,我试图理解为什么有些页面被编入索引,而其他页面却没有被编入索引,即使格式相似也是如此。为什么当我在整个域中进行搜索时,即使我可以在我的服务器日志中看到Google抓取了每个链接,我的网站页面也只有10%出现。 最佳答案

algorithm - 索引句子的最佳算法

想象一下,我需要为句子编制索引。让我更深入地解释一下。例如我有这些句子:美丽的天空。美丽的天空梦想。美丽的梦。据我所知,索引应该是这样的:alttexthttp://img7.imageshack.us/img7/4029/indexarb.png但我也想通过这些词中的任何一个进行搜索。例如,如果我按“the”进行搜索,它应该显示给我与“beautiful”的联系。如果我按“美丽”搜索,它应该会给我与(上一个)“The”、(下一个)“sky”和“dream”的联系。如果我按“天空”搜索,它应该给出(以前的)与“美丽”等的联系......有什么想法吗?也许您知道解决此类问题的现有算法?

c++ - STL 在 C++ 中的强大功能

我找到了STL的power在numeric计算power(TYPET,Integera)的header在O(log(a))中,但是当我编写并使用g++编译它时它给了我编译错误并说error:‘power’wasnotdeclaredinthisscope.为什么会这样?我知道在O(log(N))中编写计算的幂函数很容易购买我想知道C++的标准库中是否有现成的函数。C++11标准中没有添加任何功能吗? 最佳答案 该函数在SGI的原始STL中,但不在标准库中。在GNU库中,它作为扩展可用,__gnu_cxx::power在.

c++ - 访问位域中的所有空闲槽

我有一个uint64数组,对于所有未设置的位(0),我进行了一些评估。评估不是非常昂贵,但很少有未设置的位。分析表明我在查找下一个未设置位逻辑上花费了大量时间。有没有更快的方法(在Core2duo上)?我当前的代码可以跳过很多高1:for(inty=0;y>=1;}}(任何关于如何/是否将SIMD/CUDA化的讨论都将是一个有趣的切线!) 最佳答案 Hacker'sDelight建议进行循环展开的二进制搜索。不漂亮,但对于稀疏的未设置位来说速度很快,因为它会跳过双字/字节/半字节/等。设置好每一位。如果您可以使用SSE4a(不幸的是