草庐IT

LeetCode 139. 单词拆分(动态规划,DFS和BFS解决)

数据结构和算法 2023-04-11 原文

截止到目前我已经写了 600多道算法题,其中部分已经整理成了pdf文档,目前总共有1000多页(并且还会不断的增加),大家可以免费下载
下载链接https://pan.baidu.com/s/1hjwK0ZeRxYGB8lIkbKuQgQ
提取码:6666


public boolean wordBreak(String s, List<String> dict) {
    boolean[] dp = new boolean[s.length() + 1];
    for (int i = 1; i <= s.length(); i++) {
        //枚举k的值
        for (int k = 0; k <= i; k++) {
            //如果往前截取全部字符串,我们直接判断子串[0,i-1]
            //是否存在于字典wordDict中即可
            if (k == i) {
                if (dict.contains(s.substring(0, i))) {
                    dp[i] = true;
                    continue;
                }
            }
            //递推公式
            dp[i] = dp[i - k] && dict.contains(s.substring(i - k, i));
            //如果dp[i]为true,说明前i个字符串结果拆解可以让他的所有子串
            //都存在于字典wordDict中,直接终止内层循环,不用再计算dp[i]了。
            if (dp[i]) {
                break;
            }
        }
    }
    return dp[s.length()];
}

上面代码有一个判断,就是截取的是前面全部字符串的时候要单独判断,其实当截取全部的时候我们只需要判断这个字符串是否存在于字典wordDict中即可,可以让dp[0]truedp[0]表示的是空字符串。这样代码会简洁很多,我们来看下

public boolean wordBreak(String s, List<String> dict) {
    boolean[] dp = new boolean[s.length() + 1];
    dp[0] = true;//边界条件
    for (int i = 1; i <= s.length(); i++) {
        for (int j = 0; j < i; j++) {
            dp[i] = dp[j] && dict.contains(s.substring(j, i));
            if (dp[i]) {
                break;
            }
        }
    }
    return dp[s.length()];
}

这个和第一种写法不太一样,这个每次截取的方式如下图所示。




每次截取一个子串,判断他是否存在于字典中,如果不存在于字典中,继续截取更长的子串……如果存在于字典中,然后递归拆分剩下的子串,这是一个递归的过程。上面的执行过程我们可以把它看做是一棵n叉树的DFS遍历,所以大致代码我们可以列出来

public boolean wordBreak(String s, List<String> wordDict) {
    return dfs(s, wordDict);
}

public boolean dfs(String s, List<String> wordDict) {
    if (最终条件,都截取完了,直接返回true)
    return true;
    //开始拆分字符串s
    for (int i = 开始截取的位置; i <= s.length(); i++) {
        //如果截取的子串不在字典中,继续截取更大的子串
        if (!wordDict.contains(截取子串))
            continue;
        //如果截取的子串在字典中,继续剩下的拆分,如果剩下的可以拆分成
        //在字典中出现的单词,直接返回true,如果不能则继续
        //截取更大的子串判断
        if (dfs(s, wordDict))
            return true;
    }
    //如果都不能正确拆分,直接返回false
    return false;
}

上面代码中因为递归必须要有终止条件,通过上面的图我们可以发现,终止条件就是把字符串s中的所有字符都遍历完了,这个时候说明字符串s可以拆分成一些子串,并且这些子串都存在于字典中。我们来看个图


因为是拆分,所以字符串截取的时候不能有重叠,那么[开始截取的位置]实际上就是上次截取位置的下一个,来看下代码。

public boolean wordBreak(String s, List<String> wordDict) {
    return dfs(s, wordDict, 0);
}

//start表示的是从字符串s的哪个位置开始
public boolean dfs(String s, List<String> wordDict, int start) {
    //字符串中的所有字符都遍历完了,也就是到叶子节点了,说明字符串s可以拆分成
    //在字典中出现的单词,直接返回true
    if (start == s.length())
        return true;
    //开始拆分字符串s,
    for (int i = start + 1; i <= s.length(); i++) {
        //如果截取的子串不在字典中,继续截取更大的子串
        if (!wordDict.contains(s.substring(start, i)))
            continue;
        //如果截取的子串在字典中,继续剩下的拆分,如果剩下的可以拆分成
        //在字典中出现的单词,直接返回true,如果不能则继续
        //截取更大的子串判断
        if (dfs(s, wordDict, i))
            return true;
    }
    return false;
}

实际上上面代码运行效率很差,这是因为如果字符串s比较长的话,这里会包含大量的重复计算,我们还用上面的图来看下


我们看到红色的就是重复计算,这里因为字符串比较短,不是很明显,当字符串比较长的时候,这里的重复计算非常多。我们可以使用一个变量,来记录计算过的位置,如果之前判断过,就不在重复判断,直接跳过即可,代码如下

public boolean wordBreak(String s, List<String> wordDict) {
    return dfs(s, wordDict, new HashSet<>(), 0);
}

//start表示的是从字符串s的哪个位置开始
public boolean dfs(String s, List<String> wordDict, Set<Integer> indexSet, int start) {
    //字符串都拆分完了,返回true
    if (start == s.length())
        return true;
    for (int i = start + 1; i <= s.length(); i++) {
        //如果已经判断过了,就直接跳过,防止重复判断
        if (indexSet.contains(i))
            continue;
        //截取子串,判断是否是在字典中
        if (wordDict.contains(s.substring(start, i))) {
            if (dfs(s, wordDict, indexSet, i))
                return true;
            //标记为已判断过
            indexSet.add(i);
        }
    }
    return false;
}



BFS一般不需要递归,只需要使用一个队列记录每一层需要记录的值即可。BFS中在截取的时候,如果截取的子串存在于字典中,我们就要记录截取的位置,到下一层的时候就从这个位置的下一个继续截取,来看下代码。

public boolean wordBreak(String s, List<String> wordDict) {
    //这里为了提高效率,把list转化为set,因为set的查找效率要比list高
    Set<String> setDict = new HashSet<>(wordDict);
    //记录当前层开始遍历字符串s的位置
    Queue<Integer> queue = new LinkedList<>();
    queue.add(0);
    int length = s.length();
    while (!queue.isEmpty()) {
        int index = queue.poll();
        //如果字符串到遍历完了,自己返回true
        if (index == length)
            return true;
        for (int i = index + 1; i <= length; i++) {
            if (setDict.contains(s.substring(index, i))) {
                queue.add(i);
            }
        }
    }
    return false;
}

这种也会出现重复计算的情况,所以这里我们也可以使用一个变量来记录下。

public boolean wordBreak(String s, List<String> wordDict) {
    //这里为了提高效率,把list转化为set,因为set的查找效率要比list高
    Set<String> setDict = new HashSet<>(wordDict);
    //记录当前层开始遍历字符串s的位置
    Queue<Integer> queue = new LinkedList<>();
    queue.add(0);
    int length = s.length();
    //记录访问过的位置,减少重复判断
    boolean[] visited = new boolean[length];
    while (!queue.isEmpty()) {
        int index = queue.poll();
        //如果字符串都遍历完了,直接返回true
        if (index == length)
            return true;
        //如果被访问过,则跳过
        if (visited[index])
            continue;
        //标记为访问过
        visited[index] = true;
        for (int i = index + 1; i <= length; i++) {
            if (setDict.contains(s.substring(index, i))) {
                queue.add(i);
            }
        }
    }
    return false;
}

有关LeetCode 139. 单词拆分(动态规划,DFS和BFS解决)的更多相关文章

  1. ruby - 如何在 Ruby 中拆分参数字符串 Bash 样式? - 2

    我正在为一个项目制作一个简单的shell,我希望像在Bash中一样解析参数字符串。foobar"helloworld"fooz应该变成:["foo","bar","helloworld","fooz"]等等。到目前为止,我一直在使用CSV::parse_line,将列分隔符设置为""和.compact输出。问题是我现在必须选择是要支持单引号还是双引号。CSV不支持超过一个分隔符。Python有一个名为shlex的模块:>>>shlex.split("Test'helloworld'foo")['Test','helloworld','foo']>>>shlex.split('Test"

  2. ruby-on-rails - 在 ruby​​ 中使用 gsub 函数替换单词 - 2

    我正在尝试用ruby​​中的gsub函数替换字符串中的某些单词,但有时效果很好,在某些情况下会出现此错误?这种格式有什么问题吗NoMethodError(undefinedmethod`gsub!'fornil:NilClass):模型.rbclassTest"replacethisID1",WAY=>"replacethisID2andID3",DELTA=>"replacethisID4"}end另一个模型.rbclassCheck 最佳答案 啊,我找到了!gsub!是一个非常奇怪的方法。首先,它替换了字符串,所以它实际上修改了

  3. ruby - 正则表达式将非英文字母匹配为非单词字符 - 2

    @raw_array[i]=~/[\W]/非常简单的正则表达式。当我用一些非拉丁字母(具体来说是俄语)尝试时,条件是错误的。我能用它做什么? 最佳答案 @raw_array[i]=~/[\p{L}]/使用西里尔字符进行测试。引用:http://www.regular-expressions.info/unicode.html#prop 关于ruby-正则表达式将非英文字母匹配为非单词字符,我们在StackOverflow上找到一个类似的问题: https://

  4. Python 刷Leetcode题库,顺带学英语单词(31) - 2

    ValidPalindromeGivenastring,determineifitisapalindrome,consideringonlyalphanumericcharactersandignoringcases. [#125]Example:"Aman,aplan,acanal:Panama"isapalindrome."raceacar"isnotapalindrome.Haveyouconsiderthatthestringmightbeempty?Thisisagoodquestiontoaskduringaninterview.Forthepurposeofthisproblem

  5. ruby - 在 Ruby 中动态创建数组 - 2

    有没有办法在Ruby中动态创建数组?例如,假设我想遍历用户输入的书籍数组:books=gets.chomp用户输入:"TheGreatGatsby,CrimeandPunishment,Dracula,Fahrenheit451,PrideandPrejudice,SenseandSensibility,Slaughterhouse-Five,TheAdventuresofHuckleberryFinn"我把它变成一个数组:books_array=books.split(",")现在,对于用户输入的每一本书,我想用Ruby创建一个数组。伪代码来做到这一点:x=0books_array.

  6. ruby - 是否可以将 IRB 提示配置为动态更改? - 2

    我想在IRB中浏览文件系统并让提示更改以反射(reflect)当前工作目录,但我不知道如何在每个命令后进行提示更新。最终,我想在日常工作中更多地使用IRB,让bash溜走。我在我的.irbrc中试过这个:require'fileutils'includeFileUtilsIRB.conf[:PROMPT][:CUSTOM]={:PROMPT_N=>"\e[1m:\e[m",:PROMPT_I=>"\e[1m#{pwd}>\e[m",:PROMPT_S=>"FOO",:PROMPT_C=>"\e[1m#{pwd}>\e[m",:RETURN=>""}IRB.conf[:PROMPT_MO

  7. ruby-on-rails - carrierwave:在序列化动态属性上安装 uploader - 2

    首先,我使用的是rails3.1.3和来自master的carrierwavegithub仓库的分支。我使用after_init钩子(Hook)来确定基于属性的字段页面模型实例并为这些字段定义属性访问器将值存储在序列化哈希中(希望它清楚我是什么谈论)。这是我正在做的事情的精简版:classPage省略mount_uploader命令让我可以访问我想要的属性。但是当我安装uploader时出现错误消息说“nil类的未定义新方法”我在源代码中读到有方法read_uploader和扩展模块中的write_uploader。我如何必须覆盖这些来制作mount_uploader命令使用我的“虚拟

  8. ruby - 如何在 Cucumber 步骤定义中使单词可选? - 2

    我在下面有一个步骤定义,它执行我想要它执行的操作,即它根据“PAGES”哈希的“page”元素检查页面的url。Then(/^Ishould(still)?beatthe"(.*)"page$/)do|still,page|BROWSER.url.should==PAGES[page]end步骤定义用于两者我应该在...页面我应该还在...页面但是,我不需要将“still”传递到block中。我只需要它是可选的以匹配步骤但不传递到block中。我该怎么做?谢谢。 最佳答案 您想将“静止”组标记为非捕获。这是通过使用?:启动组来完成的

  9. ruby - 在 Ruby 中动态生成多维数组 - 2

    我正在尝试动态构建一个多维数组。我想要的基本上是这样的(为简单起见写出来):b=0test=[[]]test[b]这给了我错误:NoMethodError:undefinedmethod`test=[[],[],[]]而且它工作正常,但在我的实际使用中,我不会事先知道需要多少个数组。有一个更好的方法吗?谢谢 最佳答案 不需要像您正在使用的索引变量。只需将每个数组附加到您的test数组:irb>test=[]=>[]irb>test[["a","b","c"]]irb>test[["a","b","c"],["d","e","f"]]

  10. ruby-on-rails - 使用 gmaps4rails 动态加载谷歌地图标记 - 2

    如何只加载map边界内的标记gmaps4rails?当然,在平移和/或缩放后加载新的。与此直接相关的是,如何获取map的当前边界和缩放级别? 最佳答案 我是这样做的,我只在用户完成平移或缩放后替换标记,如果您需要不同的行为,请使用不同的事件监听器:在你看来(index.html.erb):{"zoom"=>15,"auto_adjust"=>false,"detect_location"=>true,"center_on_user"=>true}},false,true)%>在View的底部添加:functiongmaps4rail

随机推荐