草庐IT

python - 在python中最小化函数的最快方法是什么?

coder 2023-08-26 原文

所以我有以下问题要最小化。我有一个矢量 w我需要找到以最小化以下功能:

import numpy as np
from scipy.optimize import minimize

matrix = np.array([[1.0, 1.5, -2.],
                   [0.5, 3.0, 2.5],
                   [1.0, 0.25, 0.75]])

def fct(x):
    return x.dot(matrix).dot(x)

x0 = np.ones(3) / 3
cons = ({'type': 'eq', 'fun': lambda x: x.sum() - 1.0})
bnds = [(0, 1)] * 3

w = minimize(fct, x0, method='SLSQP', bounds=bnds, constraints=cons)['x']

我选择了method='SLSQP'因为它似乎是唯一一个允许 boundsconstraints .我的问题是我将不得不在多个选择上循环我的解决方案,所以我试图在这里获得一些速度。我的解决方案是使用优化器最快的解决方案还是有其他更快的解决方案?谢谢。

最佳答案

介绍

一般来说,最快的方法总是最适合问题的。

由于 scipy.minimize 中的所有优化算法都非常通用,因此将
始终是更快的方法,从问题的特殊特征中获得性能。
这将是一种权衡,需要进行多少分析和工作才能获得性能。

需要注意的是,例如 SLSQP 是一种算法,它能够
解决非凸问题,在这种情况下可以保证收敛到一些局部最优
(忽略实现中的数值问题;这始终是一个可能的问题)。

这种能力是有代价的:与算法相比,SLSQP 的速度和健壮性都会降低
它们是专门为凸问题设计的(甚至在凸问题中,尽管
它们都是多项式可解的,有更简单的线性规划和更难的
作为半定规划)。

问题分析

如上面的评论所示,对于一些一般的 不定矩阵 M ,这个问题
非凸面 (很有可能;我没有给出正式的证据),这意味着,
没有进一步的假设就没有普遍可行的方法(忽略
特殊分析,因为一些非凸问题可以在多项式时间内全局解决)。

这意味着:

  • scipy 中的每个优化算法最多只能保证局部最优,这可能
    与全局最优相比,绝对糟糕

  • 假设:M 是正定/负定

    如果我们假设矩阵 M 是正定或负定,但不是不定的,则这是一个凸优化问题。由于您似乎对这种情况感兴趣,因此这里有一些评论和方法。

    这意味着:
  • SLSQP 保证收敛到全局最优
  • 您可以使用专为凸优化问题设计的求解器
  • 商业求解器:Gurobi、CPLEX、Mosek
  • 开源求解器:ECOS、SCS

  • 使用 Python + cvxpy + ecos/scs 的示例代码

    除了用于线性规划的 linprog 之外,没有特殊的凸优化求解器
    因此无法解决这个问题。

    但是,还有其他选择,如上所述,并且有许多可能的途径
    使用它们。

    在这里,我将介绍最简单的一种:
  • cvxpy用于模型制定
  • 它会自动证明这个问题是凸的!
  • (模型构建和凸性推理的成本可能很高)
  • ecos
  • 许多凸优化问题的通用求解器
  • 基于内点法
  • scs
  • 许多凸优化问题的通用求解器
  • 基于乘法器的交替方向法(ADMM)
  • 支持两种不同的方法来求解线性方程:
  • 直接(基于分解)
  • 间接(基于共轭梯度)
  • GPU 对此的支持,因为它与矩阵向量产品有关
  • 与 ECOS 相比,解决方案通常不太准确,但通常要快得多

  • 示例代码:
  • 使用示例:
  • 1000x1000 矩阵
  • 求解器:SCS
  • 间接模式
  • CPU
  • 多线程(如果 BLAS 可用则自动)

  • 代码:
    import time
    import numpy as np
    from cvxpy import *                 # Convex-Opt
    
    """ Create some random pos-def matrix """
    N = 1000
    matrix_ = np.random.normal(size=(N,N))
    matrix = np.dot(matrix_, matrix_.T)
    
    """ CVXPY-based Convex-Opt """
    print('\ncvxpy\n')
    x = Variable(N)
    constraints = [x >= 0, x <= 1, sum(x) == 1]
    objective = Minimize(quad_form(x, matrix))
    problem = Problem(objective, constraints)
    time_start = time.perf_counter()
    problem.solve(solver=SCS, use_indirect=True, verbose=True)  # or: solver=ECOS
    time_end = time.perf_counter()
    print(problem.value)
    print('cvxpy (modelling) + ecos/scs (solving) used (secs): ', time_end - time_start)
    

    示例输出:
    cvxpy
    
    ----------------------------------------------------------------------------
        SCS v1.2.6 - Splitting Conic Solver
        (c) Brendan O'Donoghue, Stanford University, 2012-2016
    ----------------------------------------------------------------------------
    Lin-sys: sparse-indirect, nnz in A = 1003002, CG tol ~ 1/iter^(2.00)
    eps = 1.00e-03, alpha = 1.50, max_iters = 2500, normalize = 1, scale = 1.00
    Variables n = 1001, constraints m = 3003
    Cones:  primal zero / dual free vars: 1
        linear vars: 2000
        soc vars: 1002, soc blks: 1
    Setup time: 6.76e-02s
    ----------------------------------------------------------------------------
     Iter | pri res | dua res | rel gap | pri obj | dua obj | kap/tau | time (s)
    ----------------------------------------------------------------------------
         0|      inf       inf      -nan      -inf      -inf       inf  1.32e-01 
       100| 1.54e-02  1.48e-04  7.63e-01 -5.31e+00 -4.28e+01  1.10e-11  1.15e+00 
       200| 1.53e-02  1.10e-04  7.61e-01 -3.87e+00 -3.17e+01  1.08e-11  1.95e+00 
       300| 1.53e-02  7.25e-05  7.55e-01 -2.47e+00 -2.08e+01  1.07e-11  2.79e+00 
       400| 1.53e-02  3.61e-05  7.39e-01 -1.11e+00 -1.03e+01  1.06e-11  3.61e+00 
       500| 7.64e-03  2.55e-04  1.09e-01 -2.01e-01 -6.32e-02  1.05e-11  4.64e+00 
       560| 7.71e-06  4.24e-06  8.61e-04  2.17e-01  2.16e-01  1.05e-11  5.70e+00 
    ----------------------------------------------------------------------------
    Status: Solved
    Timing: Solve time: 5.70e+00s
        Lin-sys: avg # CG iterations: 1.71, avg solve time: 9.98e-03s
        Cones: avg projection time: 3.97e-06s
    ----------------------------------------------------------------------------
    Error metrics:
    dist(s, K) = 5.1560e-16, dist(y, K*) = 0.0000e+00, s'y/|s||y| = 2.4992e-17
    |Ax + s - b|_2 / (1 + |b|_2) = 7.7108e-06
    |A'y + c|_2 / (1 + |c|_2) = 4.2390e-06
    |c'x + b'y| / (1 + |c'x| + |b'y|) = 8.6091e-04
    ----------------------------------------------------------------------------
    c'x = 0.2169, -b'y = 0.2157
    ============================================================================
    0.21689554805292935
    cvxpy (modelling) + ecos/scs (solving) used (secs):  7.105745473999832
    

    额外示例:5000x5000 使用 ~ 9 分钟(没有调整参数)。

    一些小小的补充说明:
  • SCS 比 ECOS 快(预期)
  • SCS/ECOS 都比 naive(不提供 jacobi-matrix)SLSQP(至少每 N >= 100 次)都快;更快 = 大 N 的数量级
  • 我检查了这个方法与 SLSQP 的等价性小例子
  • 关于python - 在python中最小化函数的最快方法是什么?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43648073/

    有关python - 在python中最小化函数的最快方法是什么?的更多相关文章

    1. ruby - 如何使用 Nokogiri 的 xpath 和 at_xpath 方法 - 2

      我正在学习如何使用Nokogiri,根据这段代码我遇到了一些问题:require'rubygems'require'mechanize'post_agent=WWW::Mechanize.newpost_page=post_agent.get('http://www.vbulletin.org/forum/showthread.php?t=230708')puts"\nabsolutepathwithtbodygivesnil"putspost_page.parser.xpath('/html/body/div/div/div/div/div/table/tbody/tr/td/div

    2. ruby - 如何从 ruby​​ 中的字符串运行任意对象方法? - 2

      总的来说,我对ruby​​还比较陌生,我正在为我正在创建的对象编写一些rspec测试用例。许多测试用例都非常基础,我只是想确保正确填充和返回值。我想知道是否有办法使用循环结构来执行此操作。不必为我要测试的每个方法都设置一个assertEquals。例如:describeitem,"TestingtheItem"doit"willhaveanullvaluetostart"doitem=Item.new#HereIcoulddotheitem.name.shouldbe_nil#thenIcoulddoitem.category.shouldbe_nilendend但我想要一些方法来使用

    3. ruby - 为什么我可以在 Ruby 中使用 Object#send 访问私有(private)/ protected 方法? - 2

      类classAprivatedeffooputs:fooendpublicdefbarputs:barendprivatedefzimputs:zimendprotecteddefdibputs:dibendendA的实例a=A.new测试a.foorescueputs:faila.barrescueputs:faila.zimrescueputs:faila.dibrescueputs:faila.gazrescueputs:fail测试输出failbarfailfailfail.发送测试[:foo,:bar,:zim,:dib,:gaz].each{|m|a.send(m)resc

    4. ruby - Facter::Util::Uptime:Module 的未定义方法 get_uptime (NoMethodError) - 2

      我正在尝试设置一个puppet节点,但ruby​​gems似乎不正常。如果我通过它自己的二进制文件(/usr/lib/ruby/gems/1.8/gems/facter-1.5.8/bin/facter)在cli上运行facter,它工作正常,但如果我通过由ruby​​gems(/usr/bin/facter)安装的二进制文件,它抛出:/usr/lib/ruby/1.8/facter/uptime.rb:11:undefinedmethod`get_uptime'forFacter::Util::Uptime:Module(NoMethodError)from/usr/lib/ruby

    5. python - 如何使用 Ruby 或 Python 创建一系列高音调和低音调的蜂鸣声? - 2

      关闭。这个问题是opinion-based.它目前不接受答案。想要改进这个问题?更新问题,以便editingthispost可以用事实和引用来回答它.关闭4年前。Improvethisquestion我想在固定时间创建一系列低音和高音调的哔哔声。例如:在150毫秒时发出高音调的蜂鸣声在151毫秒时发出低音调的蜂鸣声200毫秒时发出低音调的蜂鸣声250毫秒的高音调蜂鸣声有没有办法在Ruby或Python中做到这一点?我真的不在乎输出编码是什么(.wav、.mp3、.ogg等等),但我确实想创建一个输出文件。

    6. ruby-on-rails - Rails - 子类化模型的设计模式是什么? - 2

      我有一个模型:classItem项目有一个属性“商店”基于存储的值,我希望Item对象对特定方法具有不同的行为。Rails中是否有针对此的通用设计模式?如果方法中没有大的if-else语句,这是如何干净利落地完成的? 最佳答案 通常通过Single-TableInheritance. 关于ruby-on-rails-Rails-子类化模型的设计模式是什么?,我们在StackOverflow上找到一个类似的问题: https://stackoverflow.co

    7. Ruby 方法() 方法 - 2

      我想了解Ruby方法methods()是如何工作的。我尝试使用“ruby方法”在Google上搜索,但这不是我需要的。我也看过ruby​​-doc.org,但我没有找到这种方法。你能详细解释一下它是如何工作的或者给我一个链接吗?更新我用methods()方法做了实验,得到了这样的结果:'labrat'代码classFirstdeffirst_instance_mymethodenddefself.first_class_mymethodendendclassSecond使用类#returnsavailablemethodslistforclassandancestorsputsSeco

    8. ruby - 什么是填充的 Base64 编码字符串以及如何在 ruby​​ 中生成它们? - 2

      我正在使用的第三方API的文档状态:"[O]urAPIonlyacceptspaddedBase64encodedstrings."什么是“填充的Base64编码字符串”以及如何在Ruby中生成它们。下面的代码是我第一次尝试创建转换为Base64的JSON格式数据。xa=Base64.encode64(a.to_json) 最佳答案 他们说的padding其实就是Base64本身的一部分。它是末尾的“=”和“==”。Base64将3个字节的数据包编码为4个编码字符。所以如果你的输入数据有长度n和n%3=1=>"=="末尾用于填充n%

    9. ruby - 解析 RDFa、微数据等的最佳方式是什么,使用统一的模式/词汇(例如 schema.org)存储和显示信息 - 2

      我主要使用Ruby来执行此操作,但到目前为止我的攻击计划如下:使用gemsrdf、rdf-rdfa和rdf-microdata或mida来解析给定任何URI的数据。我认为最好映射到像schema.org这样的统一模式,例如使用这个yaml文件,它试图描述数据词汇表和opengraph到schema.org之间的转换:#SchemaXtoschema.orgconversion#data-vocabularyDV:name:namestreet-address:streetAddressregion:addressRegionlocality:addressLocalityphoto:i

    10. ruby - 为什么 4.1%2 使用 Ruby 返回 0.0999999999999996?但是 4.2%2==0.2 - 2

      为什么4.1%2返回0.0999999999999996?但是4.2%2==0.2。 最佳答案 参见此处:WhatEveryProgrammerShouldKnowAboutFloating-PointArithmetic实数是无限的。计算机使用的位数有限(今天是32位、64位)。因此计算机进行的浮点运算不能代表所有的实数。0.1是这些数字之一。请注意,这不是与Ruby相关的问题,而是与所有编程语言相关的问题,因为它来自计算机表示实数的方式。 关于ruby-为什么4.1%2使用Ruby返

    随机推荐