基本信息

  • 题号:49

  • 题厂:亚麻

  • 难度系数:中


已知一个包含各种单词的数组。如果某单词互为 anagrams(同字母异序词),则分为一组并返回

什么是Anagram?

就是几个单词又相同字母组成,但字母排列顺序不同……例如「eat」和「tea」就是一组「同字母异序词」。

根据以上原理,输入 strs = ["eat","tea","tan","ate","nat","bat"] 返回 [["bat"],["nat","tan"],["ate","eat","tea"]]

解题思路

理解题目要求后,要判断单词之间是否互为「anagram」,需要引入数据结构 set。将已出现的 set 划归为一组即可。

而在存贮循环遍历过程中出现过的 set 组合,首先想到需要使用数据结构 HashMap。key 为 set 样式,value 为符合该样式的单词。

对于本题,题目已知单词均为 26 个小写字母,所以我们可以通过 ascii 码和长度为 26 的数组记录 set 样式。


class Solution:
    def groupAnagrams(self, strs: List[str]) -> List[List[str]]:
        # map 样式 「样式」- 所属单词
        patterns = {}
        
        # 遍历输入单词,根据对应 ascii 码获取该单词样式。如果样式已出现在 patterns 记录中,则对应添加;如果还没有,则创建新样式。
        # ⚠️数组不能作为 hashmap 的 key,需要把 数组转换为 tuple
        for s in strs:
            pattern = [0] * 26
            for c in s:
                pattern[ord(c) - 97] += 1

            pattern_key = tuple(pattern)

            if pattern_key in patterns:
                patterns[pattern_key].append(s)
            else:
                patterns[pattern_key] = [s]
        
        # 遍历分析完毕后,将分组好的单词们放进返回值 res
        res = []
        for v in patterns.values():
            res.append(v)

        return res

Constraints

  • 1 <= strs.length <= 104

  • 0 <= strs[i].length <= 100

  • strs[i] consists of lowercase English letters.

做题前要和考官讨论单词中可能出现的字符范围。本题提示只会出现小写英文字母,所以 「ascii + 数组」 解法可行。


测试

  • 当单词包含多个重复字母时

  • 当单词包含不同字母顺序不同时

  • 当输入单词长度为 0 或 100 的 edge case 时

  • ……


Big O

时间复杂度:O(n)

循环一遍,复杂度为 n,遍历单词字母,最长为 100 个字母,最差复杂度为 O(100n),化简后还是 O(n)

空间复杂度: O(n)

  • 引入 hashmap 记录 样式


总结

  • 题号靠前,属于 anagram 类别经典题

  • 本题解题思路容易想到,但数组不能作为 hashmap 的key 存储容易犯错。

  • 「acsii 码 + 数组」是处理字符串的常见技巧。

  • 同类套路相似题型:2273,242