草庐IT

c# - 使预测文本算法运行得更快

coder 2024-06-16 原文

我正在开发一个 Windows Phone 拨号器应用程序,我已经在我的应用程序中实现了预测文本。当用户点击键盘时,会生成与输入匹配的联系人。预测太慢,它也阻塞了我的主线程,这就是为什么我实现了 BackGroundWorker 但仍然存在性能问题 我的代码是:

private void dialer_TextChanged(object sender, TextChangedEventArgs e)
    {
        MainPage.DialerText = dialer.Text;
        if(!bw1.IsBusy)
        bw1.RunWorkerAsync();
     }
 void bw1_DoWork(object sender, DoWorkEventArgs e)
    {
        try
        {
            var digitMap = new Dictionary<int, string>() {
    { 1, "" },
    { 2, "[abcABC]" },
    { 3, "[defDEF]" },
    { 4, "[ghiGHI]" },
    { 5, "[jklJKL]" },
    { 6, "[mnoMNO]" },
    { 7, "[pqrsPQRS]" },
    { 8, "[tuvTUV]" },
    { 9, "[wxyzWXYZ]" },
    { 0, "" },
};
            var enteredDigits = DialerText;
            var charsAsInts = enteredDigits.ToCharArray().Select(x => int.Parse(x.ToString()));
            var regexBuilder = new StringBuilder();

            foreach (var val in charsAsInts)
            regexBuilder.Append(digitMap[val]);
            MainPage.pattern = regexBuilder.ToString();

            MainPage.pattern = ".*" + MainPage.pattern + ".*";


        }
        catch (Exception f)
        {
            //  MessageBox.Show(f.Message);
        }

    }
void bw1_RunWorkerCompleted(object sender, RunWorkerCompletedEventArgs e)
    {
        SearchListbox.ItemsSource = listobj.FindAll(x => x.PhoneNumbers.Any(a=>a.Contains(MainPage.DialerText)) | Regex.IsMatch(x.FirstName, MainPage.pattern));
    }

BackGroundWorker 也阻塞了我的主线程,因此当我点击键盘时,输入值被添加到 TextBox 时会出现延迟。我想无延迟地向 TextTox 添加输入,该怎么做?谢谢。

最佳答案

您可以通过摆脱对整个词表的详尽搜索并将您的词放入更高效的数据结构中来真正加快速度。

为了在任何大小的单词列表上快速查找(但在内存方面更昂贵),您应该构建一个包含整个单词列表的树结构。

根节点代表调用零的数字,它连接到(最多)十个节点,其中连接节点的边代表 0 到 9 可能按下的数字之一。

然后每个节点包含可能的词,这些词可以从根节点穿过树的路径形成,其中路径代表按下的数字。

这意味着搜索不再需要迭代整个单词列表,只需很少的操作即可完成。

以下是 370000 word-list 的实践概念我在网上找到的。在我的桌面上搜索大约需要 0.02 毫秒。又好又快。似乎占用大约 50MB 的内存。

void Main()
{
    var rootNode = new Node();

    //probably a bad idea, better to await in an async method
    LoadNode(rootNode).Wait(); 

    //let's search a few times to get meaningful timings    
    for(var i = 0; i < 5; ++i)
    {
        //"acres" in text-ese (specifically chosen for ambiguity)
        var searchTerm = "22737";
        var sw = Stopwatch.StartNew();
        var wordList = rootNode.Search(searchTerm);
        Console.WriteLine("Search complete in {0} ms", 
                        sw.Elapsed.TotalMilliseconds);
        Console.WriteLine("Search for {0}:", searchTerm);
        foreach(var word in wordList)
        {
            Console.WriteLine("Found {0}", word);
        }   
    }
    GC.Collect();
    var bytesAllocated = GC.GetTotalMemory(true);
    Console.WriteLine("Allocated {0} bytes", bytesAllocated);
}

async Task LoadNode(Node rootNode)
{
    var wordListUrl = 
    "https://raw.githubusercontent.com/dwyl/english-words/master/words_alpha.txt";
    Console.WriteLine("Loading words from {0}", wordListUrl);
    using(var httpClient = new HttpClient())
    using(var stream = await httpClient.GetStreamAsync(wordListUrl))
    using(var reader = new StreamReader(stream))
    {
        var wordCount = 0;
        string word;
        while( (word = await reader.ReadLineAsync()) != null )
        {
            word = word.ToLowerInvariant();
            if(!Regex.IsMatch(word,@"^[a-z]+$"))
            {
                continue;
            }
            rootNode.Add(word);
            wordCount++;
        }   
        Console.WriteLine("Loaded {0} words", wordCount);
    }
}

class Node
{
    static Dictionary<int, string> digitMap = new Dictionary<int, string>() {
        { 1, "" },
        { 2, "abcABC" },
        { 3, "defDEF" },
        { 4, "ghiGHI" },
        { 5, "jklJKL" },
        { 6, "mnoMNO" },
        { 7, "pqrsPQRS" },
        { 8, "tuvTUV" },
        { 9, "wxyzWXYZ" },
        { 0, "" }};
    static Dictionary<char,int> letterMap;
    static Node()
    {
        letterMap = digitMap
            .SelectMany(m => m.Value.Select(c=>new {ch = c, num = m.Key}))
            .ToDictionary(x => x.ch, x => x.num);
    }

    List<string> words = new List<string>();

    //the edges collection has exactly 10 
    //slots which represent the numbers [0-9]
    Node[] edges = new Node[10];

    public IEnumerable<string> Words{get{
        return words;
    }}

    public void Add(string word, int pos = 0)
    {
        if(pos == word.Length)
        {
            if(word.Length > 0)
            {
                words.Add(word);
            }
            return;
        }
        var currentChar = word[pos];
        int edgeIndex = letterMap[currentChar];
        if(edges[edgeIndex] == null)
        {
            edges[edgeIndex] = new Node();
        }
        var nextNode = edges[edgeIndex];
        nextNode.Add(word, pos+1);
    }

    public Node FindMostPopulatedNode()
    {
        Stack<Node> stk = new Stack<Node>();
        stk.Push(this);
        Node biggest = null;
        while(stk.Any())
        {
            var node = stk.Pop();
            biggest = biggest == null
               ? node
               : (node.words.Count > biggest.words.Count
                   ? node
                   : biggest);
            foreach(var next in node.edges.Where(e=>e != null))
            {
                stk.Push(next);
            }
        }
        return biggest;
    }

    public IEnumerable<string> Search(string numberSequenceString)
    {
        var numberSequence = numberSequenceString
                               .Select(n => int.Parse(n.ToString()));
        return Search(numberSequence);
    }
    private IEnumerable<string> Search(IEnumerable<int> numberSequence)
    {
        if(!numberSequence.Any())
        {
            return words;
        }
        var first = numberSequence.First();
        var remaining = numberSequence.Skip(1);
        var nextNode = edges[first];
        if(nextNode == null)
        {
            return Enumerable.Empty<string>();
        }
        return nextNode.Search(remaining);
    }
}

关于c# - 使预测文本算法运行得更快,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/26422261/

有关c# - 使预测文本算法运行得更快的更多相关文章

  1. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

    总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

  2. ruby - 使用 ruby​​ 将 HTML 转换为纯文本并维护结构/格式 - 2

    我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h

  3. ruby - 如何每月在 Heroku 运行一次 Scheduler 插件? - 2

    在选择我想要运行操作的频率时,唯一的选项是“每天”、“每小时”和“每10分钟”。谢谢!我想为我的Rails3.1应用程序运行调度程序。 最佳答案 这不是一个优雅的解决方案,但您可以安排它每天运行,并在实际开始工作之前检查日期是否为当月的第一天。 关于ruby-如何每月在Heroku运行一次Scheduler插件?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.com/questions/8692687/

  4. ruby-on-rails - 如何在 ruby​​ 中使用两个参数异步运行 exe? - 2

    exe应该在我打开页面时运行。异步进程需要运行。有什么方法可以在ruby​​中使用两个参数异步运行exe吗?我已经尝试过ruby​​命令-system()、exec()但它正在等待过程完成。我需要用参数启动exe,无需等待进程完成是否有任何ruby​​gems会支持我的问题? 最佳答案 您可以使用Process.spawn和Process.wait2:pid=Process.spawn'your.exe','--option'#Later...pid,status=Process.wait2pid您的程序将作为解释器的子进程执行。除

  5. ruby - 无法运行 Rails 2.x 应用程序 - 2

    我尝试运行2.x应用程序。我使用rvm并为此应用程序设置其他版本的ruby​​:$rvmuseree-1.8.7-head我尝试运行服务器,然后出现很多错误:$script/serverNOTE:Gem.source_indexisdeprecated,useSpecification.Itwillberemovedonorafter2011-11-01.Gem.source_indexcalledfrom/Users/serg/rails_projects_terminal/work_proj/spohelp/config/../vendor/rails/railties/lib/r

  6. ruby - Sinatra:运行 rspec 测试时记录噪音 - 2

    Sinatra新手;我正在运行一些rspec测试,但在日志中收到了一堆不需要的噪音。如何消除日志中过多的噪音?我仔细检查了环境是否设置为:test,这意味着记录器级别应设置为WARN而不是DEBUG。spec_helper:require"./app"require"sinatra"require"rspec"require"rack/test"require"database_cleaner"require"factory_girl"set:environment,:testFactoryGirl.definition_file_paths=%w{./factories./test/

  7. ruby-on-rails - 无法让 rspec、spork 和调试器正常运行 - 2

    GivenIamadumbprogrammerandIamusingrspecandIamusingsporkandIwanttodebug...mmm...let'ssaaay,aspecforPhone.那么,我应该把“require'ruby-debug'”行放在哪里,以便在phone_spec.rb的特定点停止处理?(我所要求的只是一个大而粗的箭头,即使是一个有挑战性的程序员也能看到:-3)我已经尝试了很多位置,除非我没有正确测试它们,否则会发生一些奇怪的事情:在spec_helper.rb中的以下位置:require'rubygems'require'spork'

  8. c# - 如何在 ruby​​ 中调用 C# dll? - 2

    如何在ruby​​中调用C#dll? 最佳答案 我能想到几种可能性:为您的DLL编写(或找人编写)一个COM包装器,如果它还没有,则使用Ruby的WIN32OLE库来调用它;看看RubyCLR,其中一位作者是JohnLam,他继续在Microsoft从事IronRuby方面的工作。(估计不会再维护了,可能不支持.Net2.0以上的版本);正如其他地方已经提到的,看看使用IronRuby,如果这是您的技术选择。有一个主题是here.请注意,最后一篇文章实际上来自JohnLam(看起来像是2009年3月),他似乎很自在地断言RubyCL

  9. C# 到 Ruby sha1 base64 编码 - 2

    我正在尝试在Ruby中复制Convert.ToBase64String()行为。这是我的C#代码:varsha1=newSHA1CryptoServiceProvider();varpasswordBytes=Encoding.UTF8.GetBytes("password");varpasswordHash=sha1.ComputeHash(passwordBytes);returnConvert.ToBase64String(passwordHash);//returns"W6ph5Mm5Pz8GgiULbPgzG37mj9g="当我在Ruby中尝试同样的事情时,我得到了相同sha

  10. ruby-on-rails - before_filter 运行多个方法 - 2

    是否有可能:before_filter:authenticate_user!||:authenticate_admin! 最佳答案 before_filter:do_authenticationdefdo_authenticationauthenticate_user!||authenticate_admin!end 关于ruby-on-rails-before_filter运行多个方法,我们在StackOverflow上找到一个类似的问题: https://

随机推荐