返回介绍

solution / 0100-0199 / 0182.Duplicate Emails / README

发布于 2024-06-17 01:04:03 字数 1978 浏览 0 评论 0 收藏 0

182. 查找重复的电子邮箱

English Version

题目描述

表: Person

+-------------+---------+
| Column Name | Type  |
+-------------+---------+
| id      | int   |
| email     | varchar |
+-------------+---------+
id 是该表的主键(具有唯一值的列)。
此表的每一行都包含一封电子邮件。电子邮件不包含大写字母。

 

编写解决方案来报告所有重复的电子邮件。 请注意,可以保证电子邮件字段不为 NULL。

以 任意顺序 返回结果表。

结果格式如下例。

 

示例 1:

输入: 
Person 表:
+----+---------+
| id | email   |
+----+---------+
| 1  | a@b.com |
| 2  | c@d.com |
| 3  | a@b.com |
+----+---------+
输出: 
+---------+
| Email   |
+---------+
| a@b.com |
+---------+
解释: a@b.com 出现了两次。

解法

方法一:分组统计

我们可以使用 GROUP BY 语句,按照 email 字段进行分组,然后使用 HAVING 语句,筛选出现次数大于 $1$ 的 email

import pandas as pd


def duplicate_emails(person: pd.DataFrame) -> pd.DataFrame:
  results = pd.DataFrame()

  results = person.loc[person.duplicated(subset=["email"]), ["email"]]

  return results.drop_duplicates()
# Write your MySQL query statement below
SELECT email
FROM Person
GROUP BY 1
HAVING COUNT(1) > 1;

方法二:自连接

我们可以使用自连接的方法,将 Person 表自身连接一次,然后筛选出 id 不同,但 email 相同的记录。

SELECT DISTINCT p1.email
FROM
  person AS p1,
  person AS p2
WHERE p1.id != p2.id AND p1.email = p2.email;

如果你对这篇内容有疑问,欢迎到本站社区发帖提问 参与讨论,获取更多帮助,或者扫码二维码加入 Web 技术交流群。

扫码二维码加入Web技术交流群

发布评论

需要 登录 才能够评论, 你可以免费 注册 一个本站的账号。
列表为空,暂无数据
    我们使用 Cookies 和其他技术来定制您的体验包括您的登录状态等。通过阅读我们的 隐私政策 了解更多相关信息。 单击 接受 或继续使用网站,即表示您同意使用 Cookies 和您的相关数据。
    原文