草庐IT

selenium登录豆瓣(带滑块验证)

一名不合格的王老五 2023-04-04 原文
import time
import requests
from selenium import webdriver
from selenium.webdriver.common.by import By
import cv2
from selenium.webdriver import ActionChains
from selenium.webdriver.chrome.options import Options


def pageRes(url):
    """
    获取验证码图片响应
    :param url:
    :return:
    """
    res = requests.get(url=url)
    if res.status_code == 200:
        return res.content

def writeImg(filepath, imgData):
    """
    将验证码图片保存本地
    :param filepath:
    :return:
    """
    with open(filepath, 'wb') as f:
        f.write(imgData)

def getImg(x_path, string, imgPath):
    """
    :param x_path:
    :param string:
    :param imgPath:
    :return:
    """
    try:
        time.sleep(2)
        src = driver.find_element(By.XPATH, x_path).get_attribute('src').split('*')
        link = src[0] + string
        Img = pageRes(link)
        writeImg(imgPath, Img)

    except Exception as e:
        print('---异常---')

def func_verify():
    '''
    bg: 背景图片
    tp: 缺口图片
    out:输出图片
    '''
    # 读取背景图片和缺口图片
    bg = './verifyImgOne.jpg'
    tp = './verifyImgTwo.jpg'
    #out = "output.png"
    bg_img = cv2.imread(bg, 0)  # 背景图片
    tp_img = cv2.imread(tp, 0)  # 缺口图片
    height, long = bg_img.shape[::-1]

    # 识别图片边缘
    bg_edge = cv2.Canny(bg_img, 100, 200)
    tp_edge = cv2.Canny(tp_img, 100, 200)

    # 转换图片格式
    bg_pic = cv2.cvtColor(bg_edge, cv2.COLOR_GRAY2RGB)
    tp_pic = cv2.cvtColor(tp_edge, cv2.COLOR_GRAY2RGB)

    # 缺口匹配
    res = cv2.matchTemplate(bg_pic, tp_pic, cv2.TM_CCOEFF_NORMED)
    min_val, max_val, min_loc, max_loc = cv2.minMaxLoc(res)  # 寻找最优匹配

    # 绘制方框
    th, tw = tp_pic.shape[:2]
    tl = max_loc  # 左上角点的坐标
    br = (tl[0] + tw, tl[1] + th)  # 右下角点的坐标
    #cv2.rectangle(bg_img, tl, br, (0, 0, 255), 2)  # 绘制矩形
    #cv2.imwrite(out, bg_img)  # 保存在本地
    #print(tl[0])
    # 返回缺口的X坐标
    return tl[0] * 280 / height

def get_tracks(distance):
    """
    拿到移动轨迹,模仿人的滑动行为,先匀加速,后匀减速
    匀变速运动公式:
    v = v0 + at
    s = v0t + 1/2a*t*t
    """

    # 初速度
    v = 0
    # 单位时间为0.3秒统计移动轨迹,即0.3秒内的移动位移
    t = 0.3
    # 位置/移动轨迹列表,列表内的一个元素代表0.3秒内的位移
    tracks = []
    # 当前的位移
    current = 0

    # 当距离 < mid值时开始匀加速,当距离 > mid值时开始匀减速
    mid = distance * 4/5

    # current移动位移,小于滑块的距离
    while current < distance:
        if current < mid:
            # 匀加速
            a = 2

        else:
            # 匀减速
            a = -3

        # 初速度
        v0 = v
        # 0.3秒内的位移
        s = v0*t + 1/2 * a * (t**2)
        # 当前位置
        current += s
        # 添加到轨迹列表
        tracks.append(round(s))
        # 速度已经到达v, 该速度作为下次的初速度
        v = v0 + a*t

        # 每0.3秒移动的位移所有元素移动轨迹
    return tracks


# 设置浏览器
url = 'https://movie.douban.com/'
chrome_options = Options()
chrome_options.add_argument('–disable-gpu')                                       # 谷歌文档提到需要加上这个属性来规避bug
chrome_options.add_argument('lang=zh_CN.UTF-8')                                  # 设置默认编码为utf-8
chrome_options.add_experimental_option('excludeSwitches', ['enable-automation']) # 取消chrome受自动控制提示
driver = webdriver.Chrome(options=chrome_options)
driver.get(url=url)

# 登录
driver.find_element(By.XPATH, '//*[@id="db-global-nav"]/div/div[1]/a').click()
driver.find_element(By.XPATH, '//*[@id="account"]/div[2]/div[2]/div/div[1]/ul[1]/li[2]').click()
driver.find_element(By.XPATH, '//*[@id="username"]').send_keys('账号')
driver.find_element(By.XPATH, '//*[@id="password"]').send_keys('密码')
driver.find_element(By.XPATH, '//*[@id="account"]/div[2]/div[2]/div/div[2]/div[1]/div[4]/a').click()
time.sleep(3)
element = driver.find_element(By.XPATH, '/html/body/div[8]/iframe')
driver.switch_to.frame(element)

# 获取验证码背景图
filepathOne = './verifyImgOne.jpg'
stringOne = '*&sid=6919143215671857152&img_index=1&subsid=3'
getImg('//*[@id="slideBg"]', stringOne, filepathOne)

# 获取验证码缺口图
filepathTwo  = './verifyImgTwo.jpg'
stringTwo = '*&sid=6919137859361099776&img_index=2&subsid=4'
getImg('//*[@id="slideBlock"]', stringTwo, filepathTwo)

# 移动滑块完成验证
value = func_verify()
element = driver.find_element(By.XPATH, '//*[@id="tcaptcha_drag_button"]')
ActionChains(driver).click_and_hold(element).perform()
ActionChains(driver).move_to_element_with_offset(to_element=element, xoffset=0, yoffset=0).perform()
tracks = get_tracks(int(value)+12)
for track in tracks:
    ActionChains(driver).move_by_offset(xoffset=track, yoffset=0).perform()

time.sleep(1)
ActionChains(driver).release().perform()

 被浏览器检测到,添加如下代码再次测试,应给不会有问题。


# selenium规避检测
options = webdriver.ChromeOptions()
options.add_experimental_option('excludeSwitches', ['enable-automation'])
options.add_argument("--disable-blink-features=AutomationControlled")
driver = webdriver.Chrome(options=options)
driver.execute_cdp_cmd("Page.addScriptToEvaluateOnNewDocument", {
        "source": """
                    Object.defineProperty(navigator, 'webdriver', {
                      get: () => undefined
                    })
                  """
    })

有关selenium登录豆瓣(带滑块验证)的更多相关文章

  1. ruby-on-rails - 如何验证 update_all 是否实际在 Rails 中更新 - 2

    给定这段代码defcreate@upgrades=User.update_all(["role=?","upgraded"],:id=>params[:upgrade])redirect_toadmin_upgrades_path,:notice=>"Successfullyupgradeduser."end我如何在该操作中实际验证它们是否已保存或未重定向到适当的页面和消息? 最佳答案 在Rails3中,update_all不返回任何有意义的信息,除了已更新的记录数(这可能取决于您的DBMS是否返回该信息)。http://ar.ru

  2. ruby - 具有身份验证的私有(private) Ruby Gem 服务器 - 2

    我想安装一个带有一些身份验证的私有(private)Rubygem服务器。我希望能够使用公共(public)Ubuntu服务器托管内部gem。我读到了http://docs.rubygems.org/read/chapter/18.但是那个没有身份验证-如我所见。然后我读到了https://github.com/cwninja/geminabox.但是当我使用基本身份验证(他们在他们的Wiki中有)时,它会提示从我的服务器获取源。所以。如何制作带有身份验证的私有(private)Rubygem服务器?这是不可能的吗?谢谢。编辑:Geminabox问题。我尝试“捆绑”以安装新的gem..

  3. ruby-on-rails - 如果为空或不验证数值,则使属性默认为 0 - 2

    我希望我的UserPrice模型的属性在它们为空或不验证数值时默认为0。这些属性是tax_rate、shipping_cost和price。classCreateUserPrices8,:scale=>2t.decimal:tax_rate,:precision=>8,:scale=>2t.decimal:shipping_cost,:precision=>8,:scale=>2endendend起初,我将所有3列的:default=>0放在表格中,但我不想要这样,因为它已经填充了字段,我想使用占位符。这是我的UserPrice模型:classUserPrice回答before_val

  4. ruby-on-rails - 如何验证非模型(甚至非对象)字段 - 2

    我有一个表单,其中有很多字段取自数组(而不是模型或对象)。我如何验证这些字段的存在?solve_problem_pathdo|f|%>... 最佳答案 创建一个简单的类来包装请求参数并使用ActiveModel::Validations。#definedsomewhere,atthesimplest:require'ostruct'classSolvetrue#youcouldevencheckthesolutionwithavalidatorvalidatedoerrors.add(:base,"WRONG!!!")unlesss

  5. ruby-on-rails - 如何将验证与模型分开 - 2

    我有一些非常大的模型,我必须将它们迁移到最新版本的Rails。这些模型有相当多的验证(User有大约50个验证)。是否可以将所有这些验证移动到另一个文件中?说app/models/validations/user_validations.rb。如果可以,有人可以提供示例吗? 最佳答案 您可以为此使用关注点:#app/models/validations/user_validations.rbrequire'active_support/concern'moduleUserValidationsextendActiveSupport:

  6. ruby-on-rails - 跳过状态机方法的所有验证 - 2

    当我的预订模型通过rake任务在状态机上转换时,我试图找出如何跳过对ActiveRecord对象的特定实例的验证。我想在reservation.close时跳过所有验证!叫做。希望调用reservation.close!(:validate=>false)之类的东西。仅供引用,我们正在使用https://github.com/pluginaweek/state_machine用于状态机。这是我的预订模型的示例。classReservation["requested","negotiating","approved"])}state_machine:initial=>'requested

  7. ruby - 如何在 Rails 4 中使用表单对象之前的验证回调? - 2

    我有一个服务模型/表及其注册表。在表单中,我几乎拥有服务的所有字段,但我想在验证服务对象之前自动设置其中一些值。示例:--服务Controller#创建Action:defcreate@service=Service.new@service_form=ServiceFormObject.new(@service)@service_form.validate(params[:service_form_object])and@service_form.saverespond_with(@service_form,location:admin_services_path)end在验证@ser

  8. ruby - 如何验证 IO.copy_stream 是否成功 - 2

    这里有一个很好的答案解释了如何在Ruby中下载文件而不将其加载到内存中:https://stackoverflow.com/a/29743394/4852737require'open-uri'download=open('http://example.com/image.png')IO.copy_stream(download,'~/image.png')我如何验证下载文件的IO.copy_stream调用是否真的成功——这意味着下载的文件与我打算下载的文件完全相同,而不是下载一半的损坏文件?documentation说IO.copy_stream返回它复制的字节数,但是当我还没有下

  9. 「Python|Selenium|场景案例」如何定位iframe中的元素? - 2

    本文主要介绍在使用Selenium进行自动化测试或者任务时,对于使用了iframe的页面,如何定位iframe中的元素文章目录场景描述解决方案具体代码场景描述当我们在使用Selenium进行自动化测试的时候,可能会遇到一些界面或者窗体是使用HTML的iframe标签进行承载的。对于iframe中的标签,如果直接查找是无法找到的,会抛出没有找到元素的异常。比如近在咫尺的例子就是,CSDN的登录窗体就是使用的iframe,大家可以尝试通过F12开发者模式查看到的tag_name,class_name,id或者xpath来定位中的页面元素,会抛出NoSuchElementException异常。解决

  10. ruby - 如何使用 Selenium Webdriver 根据 div 的内容执行操作? - 2

    我有一个使用SeleniumWebdriver和Nokogiri的Ruby应用程序。我想选择一个类,然后对于那个类对应的每个div,我想根据div的内容执行一个Action。例如,我正在解析以下页面:https://www.google.com/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=puppies这是一个搜索结果页面,我正在寻找描述中包含“Adoption”一词的第一个结果。因此机器人应该寻找带有className:"result"的div,对于每个检查它的.descriptiondiv是否包含单词“adoption

随机推荐