草庐IT

Selenium之入门

敢敢130 2024-05-10 原文

目录

一、Selenium简介

二、Selenium组成 

三、Selenium特点 

四、案例演示 

4.1 java爬虫入门

① 下载驱动包 

② 创建项目并导入依赖 

 ③ 入门

 4.2 相关API

① 元素选择方式

② 获取单个元素:driver.findElement

③ 获取多个元素:driver.findElements

④ 输入内容:input.sendKeys("java");

⑤ 元素点击:element.click(); 

⑥ 获取元素属性:nextPageEle.getAttribute("class");

⑦ 获取标签文本内容:titleEle.getText();


一、Selenium简介

  Selenium是一个用于Web应用程序自动化测试工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。适用于自动化测试,js动态爬虫(破解反爬虫)等领域。

二、Selenium组成 

1)Selenium IDE:嵌入到Firefox浏览器中的一个插件,实现简单的浏览器操作录制与回放功能,主要用于快速创建BUG及重现脚本,可转化为多种语言
2)Selenium RC: 核心组件,支持多种不同语言编写自动化测试脚本,通过其服务器作为代理服务器去访问应用,达到测试的目的
3)Selenium WebDriver(重点):一个浏览器自动化框架,它接受命令并将它们发送到浏览器。它是通过特定于浏览器的驱动程序实现的。它直接与浏览器通信并对其进行控制。Selenium WebDriver支持各种编程语言,如Java、C# 、PHP、Python、Perl、Ruby
4)Selenium grid:测试辅助工具,用于做分布式测试,可以并行执行多个测试任务,提升测试效率。

三、Selenium特点 

     1)开源、免费
     2)多浏览器支持:FireFox、Chrome、IE、Opera、Edge;
     3)多平台支持:Linux、Windows、MAC;
     4)多语言支持:Java、Python、Ruby、C#、JavaScript、C++;
     5)对Web页面有良好的支持;
     6)简单(API 简单)、灵活(用开发语言驱动);
     7)支持分布式测试用例执行。

四、案例演示 

爬虫:数据采集、数据清晰、数据分析!!!

4.1 java爬虫入门

我们先创建一个module项目 

① 下载驱动包 

http://chromedriver.storage.googleapis.com/index.html

注意:这里的Google要刷新完,要不然版本对不上 


 我的就 放在E盘下面

② 创建项目并导入依赖 

 <dependency>
        <groupId>org.seleniumhq.selenium</groupId>
        <artifactId>selenium-java</artifactId>
        <version>3.141.59</version>
     </dependency>

 ③ 入门

 //设置驱动
     System.setProperty("webdriver.chrome.driver","D:\\chromedriver.exe");
     //创建驱动
     WebDriver driver=new ChromeDriver();
     //与将要爬取的网站建立连接
     driver.get("https://www.baidu.com");
     //关闭浏览器
     driver.close();
     //释放资源
     driver.quit(); 

这里的图片就是我们百度的官网

我们运行它就会把我们要测试的软件给打开

我们可以根据百度的检查去对应的拿它上面的数据

 4.2 相关API

① 元素选择方式

② 获取单个元素:driver.findElement

③ 获取多个元素:driver.findElements

④ 输入内容:input.sendKeys("java");

⑤ 元素点击:element.click(); 

⑥ 获取元素属性:nextPageEle.getAttribute("class");

⑦ 获取标签文本内容:titleEle.getText();

1)Class选择:driver.findElement(By.className("s_ipt"));

 通过类选择器拿到被控制的页面的按钮元素
//        WebElement s_btn = driver.findElement(By.className("s_btn"));
//        System.out.println(s_btn.getAttribute("id"));
//        System.out.println(s_btn.getAttribute("value"));


2)ID选择:   driver.findElement(By.id("kw"));

 通过id选择器拿到页面中的元素
//        WebElement su = driver.findElement(By.id("su"));
//        System.out.println(su.getAttribute("class"));

3)name选择: driver.findElement(By.name("wd")); 

 WebElement tn = driver.findElement(By.name("tn"));
//        System.out.println(tn.getAttribute("value"));

4)tag选择:  driver.findElements(By.tagName("input")); 

获取到百度首页所有点击链接
//        List<WebElement> la = driver.findElements(By.tagName("a"));
//        for (WebElement a : la) {
            a指的是单个A标签
//            String text = a.getText();
            判空
//            if(text!=null && !"".equals(text.trim())){
//                System.out.println(text);
//            }
//        }

这里的图片效果展示不出来,自己摸索一下吧!!!!

5)link选择: driver.findElement(By.linkText("地图"));

 通过链接文本获取链接元素, 模拟点击该链接
//            driver.findElement(By.linkText("地图")).click();

就比如说:逛淘宝的时候不是都会分页,你总是要点击下一页,这个就是它的作用,模拟点击 

6)Partial link选择(a标签文本内容模糊匹配):driver.findElement(By.partialLinkText("使用百"));

  通过3获取到所有包含3的连接地址
//        List<WebElement> elements = driver.findElements(By.partialLinkText("3"));
//        for (WebElement element : elements) {
//            System.out.println(element.getText());
//        }

这里的图片效果展示不出来,自己摸索一下吧!!!

7)css选择器:driver.findElement(By.cssSelector("#kw")); 

这个就是我们从浏览器复制下来的: #hotsearch-content-wrapper > li:nth-child(1)
//       通过CSS选择器获取页面元素
//        WebElement element = driver.findElement(By.cssSelector("#hotsearch-content-wrapper > li:nth-child(1)"));
//        System.out.println(element.getText());

这里的图片效果展示不出来,自己摸索一下吧!!!

8)xpath选择:driver.findElement(By.xpath("//*[@id=\"kw\"]"));    

 WebElement element = driver.findElement(By.xpath("//*[@id=\"hotsearch-content-wrapper\"]/li[2]"));
//        System.out.println(element.getText());

这里就图片效果展示不出来,先是F12检查然后在下面右键检查找到Copy--->里面有很多操作方式,其中一种就是Copy XPath就是我们使用的一种方式

 9)模拟搜索 关键字 "禁止收敛url" 获取所有的查询结果
//        拿到百度首页input输入框
        WebElement inputsrk = driver.findElement(By.xpath("//*[@id=\"kw\"]"));

//        模拟 往 输入框输入搜索关键字
        inputsrk.sendKeys("禁止收敛url");

//        模拟等待
        Thread.sleep(3000);

//        获取百度一下的点击按钮
       driver.findElement(By.id("su")).click();

有关Selenium之入门的更多相关文章

  1. 「Python|Selenium|场景案例」如何定位iframe中的元素? - 2

    本文主要介绍在使用Selenium进行自动化测试或者任务时,对于使用了iframe的页面,如何定位iframe中的元素文章目录场景描述解决方案具体代码场景描述当我们在使用Selenium进行自动化测试的时候,可能会遇到一些界面或者窗体是使用HTML的iframe标签进行承载的。对于iframe中的标签,如果直接查找是无法找到的,会抛出没有找到元素的异常。比如近在咫尺的例子就是,CSDN的登录窗体就是使用的iframe,大家可以尝试通过F12开发者模式查看到的tag_name,class_name,id或者xpath来定位中的页面元素,会抛出NoSuchElementException异常。解决

  2. LC滤波器设计学习笔记(一)滤波电路入门 - 2

    目录前言滤波电路科普主要分类实际情况单位的概念常用评价参数函数型滤波器简单分析滤波电路构成低通滤波器RC低通滤波器RL低通滤波器高通滤波器RC高通滤波器RL高通滤波器部分摘自《LC滤波器设计与制作》,侵权删。前言最近需要学习放大电路和滤波电路,但是由于只在之前做音乐频谱分析仪的时候简单了解过一点点运放,所以也是相当从零开始学习了。滤波电路科普主要分类滤波器:主要是从不同频率的成分中提取出特定频率的信号。有源滤波器:由RC元件与运算放大器组成的滤波器。可滤除某一次或多次谐波,最普通易于采用的无源滤波器结构是将电感与电容串联,可对主要次谐波(3、5、7)构成低阻抗旁路。无源滤波器:无源滤波器,又称

  3. 微信小程序开发入门与实战(Behaviors使用) - 2

    @作者:SYFStrive @博客首页:HomePage📜:微信小程序📌:个人社区(欢迎大佬们加入)👉:社区链接🔗📌:觉得文章不错可以点点关注👉:专栏连接🔗💃:感谢支持,学累了可以先看小段由小胖给大家带来的街舞👉微信小程序(🔥)目录自定义组件-behaviors    1、什么是behaviors    2、behaviors的工作方式    3、创建behavior    4、导入并使用behavior    5、behavior中所有可用的节点    6、同名字段的覆盖和组合规则总结最后自定义组件-behaviors    1、什么是behaviorsbehaviors是小程序中,用于实现

  4. 【Java入门】使用Java实现文件夹的遍历 - 2

    遍历文件夹我们通常是使用递归进行操作,这种方式比较简单,也比较容易理解。本文为大家介绍另一种不使用递归的方式,由于没有使用递归,只用到了循环和集合,所以效率更高一些!一、使用递归遍历文件夹整体思路1、使用File封装初始目录,2、打印这个目录3、获取这个目录下所有的子文件和子目录的数组。4、遍历这个数组,取出每个File对象4-1、如果File是否是一个文件,打印4-2、否则就是一个目录,递归调用代码实现publicclassSearchFile{publicstaticvoidmain(String[]args){//初始目录Filedir=newFile("d:/Dev");Datebeg

  5. ES基础入门 - 2

    ES一、简介1、ElasticStackES技术栈:ElasticSearch:存数据+搜索;QL;Kibana:Web可视化平台,分析。LogStash:日志收集,Log4j:产生日志;log.info(xxx)。。。。使用场景:metrics:指标监控…2、基本概念Index(索引)动词:保存(插入)名词:类似MySQL数据库,给数据Type(类型)已废弃,以前类似MySQL的表现在用索引对数据分类Document(文档)真正要保存的一个JSON数据{name:"tcx"}二、入门实战{"name":"DESKTOP-1TSVGKG","cluster_name":"elasticsear

  6. ruby - 如何使用 Selenium Webdriver 根据 div 的内容执行操作? - 2

    我有一个使用SeleniumWebdriver和Nokogiri的Ruby应用程序。我想选择一个类,然后对于那个类对应的每个div,我想根据div的内容执行一个Action。例如,我正在解析以下页面:https://www.google.com/webhp?sourceid=chrome-instant&ion=1&espv=2&ie=UTF-8#q=puppies这是一个搜索结果页面,我正在寻找描述中包含“Adoption”一词的第一个结果。因此机器人应该寻找带有className:"result"的div,对于每个检查它的.descriptiondiv是否包含单词“adoption

  7. ruby - 下载位置 Selenium-webdriver Cucumber Chrome - 2

    我将Cucumber与Ruby结合使用。通过Selenium-Webdriver在Chrome中运行测试时,我想将下载位置更改为测试文件夹而不是用户下载文件夹。我当前的chrome驱动程序是这样设置的:Capybara.default_driver=:seleniumCapybara.register_driver:seleniumdo|app|Capybara::Selenium::Driver.new(app,:browser=>:chrome,desired_capabilities:{'chromeOptions'=>{'args'=>%w{window-size=1920,1

  8. 区块链入门教程(6)--WeBASE-Front节点前置服务安装 - 2

    文章目录1.任务背景2.任务目标3.相关知识点4.任务实操4.1安装配置JDK4.2启动FISCOBCOS4.3下载解压WeBASE-Front4.4拷贝sdk证书文件4.5启动节点4.6访问节点4.7检查运行状态5.任务总结1.任务背景FISCOBCOS其实是有控制台管理工具,用来对区块链系统进行各种管理操作。但是对于初学者来说,还是可视化界面更友好,本节就来介绍WeBASE管理平台,这是一款微众银行开源的自研区块链中间件平台,可以降低区块链使用的门槛,大幅提高区块链应用的开发效率。微众银行是腾讯牵头设立的民营银行,在国内民营银行里还是比较出名的。微众银行参与FISCOBCOS生态建设,一定

  9. Tcl脚本入门笔记详解(一) - 2

    TCL脚本语言简介•TCL(ToolCommandLanguage)是一种解释执行的脚本语言(ScriptingLanguage),它提供了通用的编程能力:支持变量、过程和控制结构;同时TCL还拥有一个功能强大的固有的核心命令集。TCL经常被用于快速原型开发,脚本编程,GUI和测试等方面。•实际上包含了两个部分:一个语言和一个库。首先,Tcl是一种简单的脚本语言,主要使用于发布命令给一些互交程序如文本编辑器、调试器和shell。由于TCL的解释器是用C\C++语言的过程库实现的,因此在某种意义上我们又可以把TCL看作C库,这个库中有丰富的用于扩展TCL命令的C\C++过程和函数,所以,Tcl是

  10. Simulink方法总结和避坑指南(一)——Simulink入门与基本调试方法 - 2

    文章目录一、项目场景二、基本模块原理与调试方法分析——信源部分:三、信号处理部分和显示部分:四、基本的通信链路搭建:四、特殊模块:interpretedMATLABfunction:五、总结和坑点提醒一、项目场景  最近一个任务是使用simulink搭建一个MIMO串扰消除的链路,并用实际收到的数据进行测试,在搭建的过程中也遇到了不少的问题(当然这比vivado里面的debug好不知道多少倍)。准备趁着这个机会,先以一个很基本的通信链路对simulink基础和相关的debug方法进行总结。  在本篇中,主要记录simulink的基本原理和基本的SISO通信传输链路(QPSK方式),计划在下篇记

随机推荐