1010cc时时彩标准版 > 1010cc三分网站 > 1010cc时时彩标准版:SQLOS任务调度算法,任务调度

原标题:1010cc时时彩标准版:SQLOS任务调度算法,任务调度

浏览次数:52 时间:2019-09-01

 

参考:

步骤八:查看SCHEDULER

 一.概念

   SOS_SCHEDULER_YIELD等待类型是一个任务自愿放弃当前的资源占用,让给其他任务使用。   这个等待类型与CPU有直接关系,与内存与也有间接关系,与CPU有关系是因为在sql server里是通过任务调度SCHEDULER来关联CPU。 通过SCHEDULER下的Worker线程来处理SQL任务。为什么跟内存有关系呢,是因为获取的资源需要内存来承载。 
  Yelding的发生:是指SCHEDULER上运行的Worker都是非抢占式的, 在 SCHEDULER上Worker由于资源等待,让出当前Worker给其它Worker就叫Yielding。 关于SCHEDULER_YIELD产生的原理查看  sqlserver 任务调度与CPU。SOS_SCHEDULER_YIELD 等待的情况可以了解到:

  (1)CPU有压力

  (2) SQL Server CPU scheduler 使用得当处理就会效率高。

1.1 从实例级别来查看等待数

select wait_type,
waiting_tasks_count,
wait_time_ms ,
max_wait_time_ms,
signal_wait_time_ms
from sys.dm_os_wait_stats
where wait_type like 'SOS_SCHEDULER_YIELD%' 
order by wait_type

  查询如下图所示: 

1010cc时时彩标准版 1

  这个等待类型排名第二,从请求的次数来说有69367060次,也就是说该线程用完了4ms的时间片,主动放弃cpu。如果没有大量的runnable队列或者大量的signal wait,证明不一定是cpu问题。因为这两个指标是cpu压力的一个体现。需要检查执行计划中是否存在大量扫描操作。

1.2 通过dmv scheaduler的描述查看cpu压力

SELECT scheduler_id, current_tasks_count, runnable_tasks_count, work_queue_count, pending_disk_io_count
FROM sys.dm_os_schedulers
WHERE scheduler_id < 255

  如下图所示:

1010cc时时彩标准版 2

  如果你注意到runnable_tasks_count计数有两位数,持续很长时间(一段时间内),你就会知道CPU压力。两位数字通常被认为是一件坏事 无法应对当前负荷。另外可以通过性能监视器%Processor Time 来查看CPU的状况。

1.3 通过案例实时查看sql语句级的资源等待

SELECT * FROM sys.dm_exec_requests  WHERE wait_type LIKE 'SOS_SCHEDULER_YIELD%'

  -- 或查找资源等待的
  SELECT session_id ,status ,blocking_session_id
  ,wait_type ,wait_time ,wait_resource
  ,transaction_id
  FROM sys.dm_exec_requests
  WHERE status = N'suspended';

  如下图所示 运行sys.dm_exec_requests 表,由于字段多截取了三断。会话202的sql 语句上一次 等待类型是SOS_SCHEDULER_YIELD。之所以会出现YIELD,是因为SCHEDULER下的Worker已经发起了task 命令,但由于资源等待 如锁或者磁盘输入/输出等,Worker又是非抢占式,所以让出了当前的Worker。

1010cc时时彩标准版 3

1010cc时时彩标准版 4

1010cc时时彩标准版 5

1.4 减少sos_scheduler_yield 等待

  正如上面所讨论的,这种等待类型与CPU压力有关。增加更多CPU是简单的解决方案,然而实现这个解决方案并不容易。当这个等待类型很高时,你可以考虑其他的事情。这里通过从缓存中找到与CPU相关的最昂贵的SQL语句。

--查询编译以来 cpu耗时总量最多的前50条(Total_woker_time) 第一种查询
select
'total_worker_time(ms)'=(total_worker_time/1000),
q.[text], --DB_NAME(dbid),OBJECT_NAME(objectid),
execution_count,
'max_worker_time(ms)'=(max_worker_time/1000),
'last_worker_time(ms)'=(last_worker_time/1000),
'min_worker_time(ms)'=(min_worker_time/1000),
'max_elapsed_time(ms)'=(max_elapsed_time/1000),
'min_elapsed_time(ms)'=(min_elapsed_time/1000),
'last_elapsed_time(ms)'=(last_elapsed_time/1000),
total_physical_reads,
last_physical_reads,
min_physical_reads,
max_physical_reads,
total_logical_reads,
last_logical_reads,
max_logical_reads,
creation_time,
last_execution_time
from
(select top 50 qs.* from sys.dm_exec_query_stats qs order by qs.total_worker_time desc)
as highest_cpu_queries cross apply sys.dm_exec_sql_text(highest_cpu_queries.plan_handle) as q
1010cc时时彩标准版,order by highest_cpu_queries.total_worker_time DESC

 

cost threshold for parallelism Option.aspx)

  2.3  Task

    在Worker上运行的最小任务单元。最简单的Task就是一个简单的Batch,当一个会话发出一个请求时,Sql server会把这个请求拆分一个或多个任务(Tasks),然后关联对应个数的工作者线程(worker thread)。

              例如下面是二个Task ,二个Task可能不是同一个Worker。二个Worker也可能不是同一个Scheduler.            

select @@servername
Go
select getdate()
GO

   每个Task线程都有3个状态:

    Running: 一个处理器在某个时间只能做一件事情,当一个线程正在一个处理器上运行时,这个线程的状态就是running。

    Suspended: 没有足够资源时,当前线程放弃占有处理器,变成挂起状态。

    Runnable: 一个线程已完成了等待,但还没有轮到它运行,就会变成runnable状态,这种信号等待(signal wait)

 

begin tran
update TEST set name='bbb' where [ID] = 1

1,编译执行计划,生成执行计划是非常消耗CPU资源的操作,当一个语句生成执行计划之后,SQL Server将其存储在Plan Cache中,以便重用执行计划。

  2.5 调度关系图如下:

              1010cc时时彩标准版 6

 

1010cc时时彩标准版 7

当Task主动Yield时,查询请求处于SOS_SCHEDULER_YIELD等待,等待被重新调用。多数情况下,出现 SOS_SCHEDULER_YIELD 等待是由于查询语句正在进行表或索引扫描,原因可能是缺失相应的索引,统计信息过期,优化器选择差的查询计划,产生参数嗅探,或者查询脚本强制不适用索引等

  2.2  Worker

     Worker又称为WorkerThread,每个Worker跟一个线程,是Sql server任务的执行单位。 多个Worker对应一个Scheduler,公式Workers=max worker threads/onlines scheduler。在一个Scheduler上,同一时间只能有一个Worker运行。例如4个处理器的64位操作系统,它的每个Scheduler的Worker是512/4=128。

2.

1010cc时时彩标准版 8

CXPACKET 等待类型是SQL Server 并发执行一个查询时产生的。在执行查询请求时,SQL Server充分利用系统的所有资源(CPU,Memory,Disk IO),争取在最短时间内返回结果。在拥有多个处理器的系统中,如果将一个查询请求的工作负载(Wordload)分布在多个处理器上,那么每个处理器只处理一部分数据,这将成倍的减少执行查询请求的时间消耗,相应地,成倍的提高查询性能。

  2.4 Yielding

                Yelding就是所有逻辑scheduler上运行的Worker都是非抢占式的, 在 Scheduler上Worker由于资源等待,让出给其它Worker就叫Yielding。

    下面讲述几种发生的状态:

    1. 当Woker在Scheduler上运行了超过4ms,就做Yielding。

    2. 每做64k的结果集的排序,就会做一次Yielding。

    3. 做语句Complie编译的过程中,这个过程比较占CPU资源时,经常会有Yielding等。

--读取数据页时

步骤三:

sp_configure 'show advanced options', 1;
GO
reconfigure;
GO
sp_configure 'cost threshold for parallelism', 6;
GO
reconfigure;
GO

sp_configure 'show advanced options', 1;
GO
RECONFIGURE WITH OVERRIDE;
GO
sp_configure 'max degree of parallelism', 8;
GO
RECONFIGURE WITH OVERRIDE;
GO

二. CPU 的配置

    在Sql server 里点击数据库实例右键到属性,选择处理器进行配置。最大工作线程数的默认值是0 (注意这里配置的是worker它是对CPU的真正封装)。这使得SQL Server能够在启动时自动配置工作线程的数量。默认设置对于大多数系统是最好的。但是,根据您的系统配置,将最大工作线程数设置为一个特定的值有时会提高性能。当查询请求的实际数量小于最大工作线程数时,一个线程处理一个查询请求。但是,如果查询请求的实际数量超过最大线程量时,SQLServer会将Worker Threads线程池化,以便下一个可用的工作线程可以处理请求。

      配置如下图所示:

        1010cc时时彩标准版 9

          也可以通过T-sql配置,下例通过sp_configure将max worker线程选项配置为900

USE AdventureWorks2012 ;  
GO  
EXEC sp_configure 'show advanced options', 1;  
GO  
RECONFIGURE ;  
GO  
EXEC sp_configure 'max worker threads', 900 ;  
GO  
RECONFIGURE; 

    Max Worker Threads服务器配置选项不考虑的线程, 像高可用、Service Broker、 Lock 管理等其它。如果配置的线程数量超过了,下面的查询将提供关于系统任务产生的额外线程信息

       is_user_process = 0 表示系统任务,非用户任务。

SELECT  s.session_id, r.command, r.status,  r.wait_type, r.scheduler_id, w.worker_address,  
w.is_preemptive, w.state, t.task_state,  t.session_id, t.exec_context_id, t.request_id  
FROM sys.dm_exec_sessions AS s  
INNER JOIN sys.dm_exec_requests AS r  
ON s.session_id = r.session_id  
INNER JOIN sys.dm_os_tasks AS t  
ON r.task_address = t.task_address  
INNER JOIN sys.dm_os_workers AS w  
ON t.worker_address = w.worker_address  
WHERE s.is_user_process = 0;

    下面显示每个用户的活动会话数

SELECT login_name ,COUNT(session_id) AS session_count  
FROM sys.dm_exec_sessions 
WHERE status<>'sleeping'
GROUP BY login_name;  

    下表显示了各种CPU和SQLServer组合的最大工作线程的自动配置数量。

Number of CPUs

32-bit computer

64-bit computer

<= 4 processors

256

512

8 processors

288

576

16 processors

352

704

32 processors

480

960

64 processors

736

1472

128 processors

4224

4480

256 processors

8320

8576

    

  根据微软的建议:这个选项是一个高级选项,应该只由经验丰富的数据库管理员或经过认证的SQL Server专业人员更改。如果您怀疑存在性能问题,则可能不是工作线程的可用性。原因更像是I/O,这会导致工作线程等待。在更改最大工作线程设置之前,最好找到性能问题的根本原因。

  1. worker在运行中需要等待获取其他资源而被造成阻塞,在阻塞发生时却换,称为natual yield;

  2. worker在长时间运行或某个阶段结束时发生却换,称为voluntarily yield;

【总结】 

What is the CXPACKET Wait Type, and How Do You Reduce It?

  2.1 Scheduler任务调度

              Sqlserver 的一个Scheduler对应操作系统上的一个逻辑CPU用于任务分配。调度分配从NUMA节点级别开始。基本算法是一个用于新连接的循环调度。当每个新的连接到达时,它被分配给基于循环的调度器。在相同的NUMA节点内,以最小的负载因子分配给调度器的新连接。

--由于SQL Server使用合作的线程调度模式,如果某一个Worker长期占用scheduler就会导致该scheduler上其他runable的worker长时间得不到运行,因此需要SQL Server根据一定策略来将该worker切换出来让其他worker得以运行。Worker切换出来的过程称之为yield,yield可大致分为两种:

我们了解了SQL SERVER任务调度的机制,那么有些问题,就会更加清楚。

3,以并发方式执行查询请求,并发控制受到配置选项 Maximum Degree of Parallelism 和 Cost Threshold of Parallelism的影响。

一. 概述

    我们知道在操作系统看来, sql server产品与其它应用程序一样,没有特别对待。但内存,硬盘,cpu又是数据库系统最重要的核心资源,所以在sql server 2005及以后出现了SQLOS,这个组件是sqlserver和windows的中间层,用于CPU的任务调度,解决I/O的资源争用,协调内存管理等其它的资源协调工作。下面我来试着讲讲SQLOS下的Scheduler调度管理。

--对于每个Scheduler,会有一字段load_factor来表示scheduler的繁忙程度,从而动态地将新Worker分配给负载最小的Scheduler,但对于同一个连接,SQL Server会记住该连接最后一个worker使用的scheduler_id,并尽可能为该连接上后续的worker分配给同一个scheduler(为了减小查找最小负载scheduler的开销),但如果该scheduler上负载大于所有scheduler负载平均值的20%,SQL Server会为新worker分配负载最低的scheduler。

步骤二:

Should you worry about SOS_SCHEDULER_YIELD?

二.调度原理

--在负载严重或Scheduler被离线时,一个CPU可能对应多个Scheduler。

打开另外一个窗口,执行下面的语句,我们会看到,下面的查询会一直在执行,因为我们前面的一个transaction并没有关闭。从查询窗口,我们可以看到,下面语句执行的SPID为58

参考文档:

  2.5  Task在调度运行图如下:

               1010cc时时彩标准版 10  

  1. 当 Task 是Runnig时,它是Schedler的活动Worker。
  2. 当 Task只等待CPU运行时,它被放入Schedler可运行的队列中。
  3. 当 Task 在等待某个资源时(比如锁、磁盘输入/输出等)时,它处于“Suspended挂起状态” 状态。
  4. 如果Task Scheduler挂起状态完成了等待,那么它就会被放到Scheduler 的Runnable队列的末尾。
  5. 如果运行线程自动Yidlding让步,则将其放回Scheduler 的Runnable队列的末尾。
    6. 如果运行的线程需要等待某个资源,它将被调出Scheduler调度器并进入挂起状态Waiter list。
    7. 如果正在运行的线程完成它的工作,那么Runnable队列的顶部的第一个线程就变成了“运行”线程。

    

--SQL SERVER OS 采用合作模式的线程调度模式,即除非Worker主动放弃CPU,否则SQL OS 不会强制剥夺其CPU,从而减少Context Switch

WORKER 用完。我们可以做一个小实验。我们在一台32位机器上,创建上面提及的测试数据库,并且,开启一个同样的未关闭transaction的update语句。

在发现一个Task比较复杂时,SQL Server会生成多个Child Task,使用多个Thread并发执行该Task,从而提高整体的响应时间,Maximum DOP(Degree of Parallelism)选项控制查询的并发度,决定一个Task在一个时间点最多可以拥有线程的数量。

三. 使用dmv任务查看

   3.1.  通过sys.dm_os_sys_info 查看scheduler与cpu的关系如下:

 SELECT cpu_count,max_workers_count,scheduler_count FROM sys.dm_os_sys_info

  1010cc时时彩标准版 11

  3.2  查看最大Worker数  

select max_workers_count from sys.dm_os_sys_info  

  3.3  查看Task与Worker关系

--在每一个连接里,我们可能会有很多batch,分解成多个task以支持如并行查询
 select task_address,task_state,scheduler_id,session_id,worker_address  
 from sys.dm_os_tasks  where session_id>50

select state,last_wait_type,tasks_processed_count,task_address, worker_address, scheduler_address
 from sys.dm_os_workers where  worker_address  =0x00000000043621A0

 1010cc时时彩标准版 12

  3.4 查看Scheduler

--scheduler_id<255 代表用户CPU,相反代表SYSTEM SCHEDULER
SELECT
    scheduler_id,
    cpu_id,
    is_online,
    current_tasks_count,
    runnable_tasks_count,
    current_workers_count,
    active_workers_count,
    work_queue_count
  FROM sys.dm_os_schedulers
  WHERE scheduler_id < 255

  cpu_id:关联的cpu 。 CPU ID  >=255 这类Scheduler都用于系统内部使用。比如说资源管理、DAC、备份还原操作等。

   is_online: 0 调度器离线,1 在线。

  current_tasks_count:当前任务数,状态包括:(等待,运行,已完成)。

  runnable_tasks_count:以分配任务,并在可运行队列中等待被调度的任务数,使用率不高的情况下,这个值会是0。

  current_workers_count:此scheduler关联的线程数。包括处于空闲状态的线程work。

  active_workers_count:当前处理活动的线程数,它必须关联任务task,包括running,runnable,suspend。

  work_queue_count:队列中的任务task等待数,如果不为0,意味着线程用尽的压力。

       讲到这里,后面讲讲CPUf过高的分析...

 

参考文献:

  Troubleshooting SQL Server Scheduling and Yielding

  Microsoft SQL Server企业级平台管理实践

  How It Works: SQL Server 2012 Database Engine Task Scheduling

 

--如果客户端不能及时取走数据,worker也会做yield

原文网址如下:

在执行Query时,SQL Server 估计其时间消耗,如果大于并发的阈值,那么SQL Server使用多个Thread(每个CPU上在同一时间只能运行一个Thread),以并发方式执行查询请求;如果低于并发阈值,那么SQL Server 使用单个Thread执行查询请iu。这个并发阈值是由选项 cost threshold for parallelism 决定的。

1010cc时时彩标准版 13

每个Scheduler上,可以有多个worker对应。Worker是真正的执行单元,Scheduler(对CPU的封装)是执行的地方。Worker的总数受max worker thread限制。每一个worker在创建的时候,自己需要申请2M内存空间。如果max worker thread为1024,并且那些worker全部创建的话,至少需要2G空间。所以太多的worker,会占用很多系统资源。

Cost Threshold of Parallelism 选项决定一个Task是否并发执行。当SQL Server 编译查询语句时,总是先做单线程的执行计划,同时计算执行计划的Cost。如果发现这个执行计划的Cost 值大于Cost Threshold of Parallelism 选项设置的值,那么SQL Server 就会改用并行执行计划。如果提高Cost Threshold of Parallelism 选项的值,SQL Server 会提高做并行执行计划的标准,从而有更少的Task会并发执行,减少CPU的利用,以便留出空闲的CPU执行其他用户的Task。

--如果Worker需要运行一些抢占式的代码,则该worker不能再由SQL OS来控制,而需要转交给Windows任务调度系统来控制,当Worker上抢占式的task运行结束后再交给scheduler来控制。

select cpu_count,max_workers_count from sys.dm_os_sys_info

二,调度产生的等待类型

--voluntarily yield便是SOS_SCHEDULER_YIELD等待的原因,发生这类yield的场景:

SELECT * FROM TEST

2,CXPACKET

本文由1010cc时时彩标准版发布于1010cc三分网站,转载请注明出处:1010cc时时彩标准版:SQLOS任务调度算法,任务调度

关键词:

上一篇:目录参数与心碎,MSSQL数据库表索引碎片整理优化

下一篇:没有了